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Acides nucleiques codant pour uns phosphatase vegetale de type MIPP a activite 

phvtasique et applications. 

La presenter inveBtion conceme des sequences d*acides nucleiques codaat pour 
5 une phosphatase vegetale de type MIPP a activite phytasique, les prot6ines isol6es codecs par 
ces s6quences, ainsi que leurs applications. 

Cette invention conceme plus precisement des sequences d' acides nucleiques de 
mais, de riz et de bl6 codant pour iine MIPP. 

10 L'importance du role du phosphore dans la nutrition animale a ete, depuis 

longtemps, reconnue. Le phosphore est essentiel a la croissance de Fanimal ; 80% du 
phosphore est localise dans le squelette. Le reste du phosphore est contenu dans les tissus 
mous ou il intervient dans de nombreuses reactions biochimiques comme la synthese des 
acides nucleiques, des phospholipides et de certaines vitamines B. 

15 Le phosphore est foumi a ranimal par T alimentation, principalement par les 

plantes. La plus grande partie du phosphate present dans les plantes, notarmnent.dans les 
semences, se trouve sous la forme de phytine, sel complexe de myo-inositol-acide 
hexakisphosphorique 6u acide phytique. La phytine constitue done une reserve de phosphore, 
de sucres, mais aussi de divers cations (Ca^"^, Zn^"^, Mg^"^, Fe^"^. 

20 La phytine, sel d'acide phytique complexe a divers cations, represente done la 

forme majeure de stockage du phosphate dans les graines mais elle est egalement presente 
dans le pollen, les organes de stockage tels que les tubercules ou dans les racines. Sa 
distribution dans les graines varie d'une espece a I'autre : 

- chez les dicotyledones (soja, ricin), elle est presente majoritairement dans les 
25 cotyledons et Falbumen ; 

- chez les cereales (ble, riz), elle est presente surtout dans Taleurone alors qu'elle 
est absente dans Talbumen ; 

- chez le mais, la majorite de la phytine presente dans le grain est stockee dans 
Tembryon (O'Dell et al., 1972; Barba et al., 1997). 

30 Dans les grains de mais, le phosphore du phytate represente jusqu'a 88 % du 

phosphore total (O'Dell et al, 1972). La degradation de la phytine est assuree par des 
phosphatases specifiques, dont les phytases, enzymes capables d'hydrolyser le phosphate a 
partir de Tacide phytique (Gibson et Ullah, 1990) en liberant du myo-inositol et du phosphate 
inorganique. 
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Toutefois les phosphatases de type phytase vegetale sont produites en quantites 
insuffisantes dans les parties des plantes utilisees po\ir T alimentation de certains animaux. 

En particulier, la phytine et Facide ph5^ique provenant de farines de semences 
seches, ne sont pas digeres par les animaux monogastriques (comme le pore et le poulet) en 
5 r absence de phosphatase exogene, et sont done excretes tels quels, lis contribuent ainsi a la 
pollution des sols et des eaux, par le phosphate, dans les zones d'elevages intensifs, De plus, 
Tacide phytique est considere comme un facteur anti-nutritionnel car 11 chelate les elements 
mineraux et provoque Tagregation des proteines. Par consequent, ces nun6raux et prot6ines 
ne seront pas correctement assimiles lors du transit intestinal, par les animaux monogastriques 
10 (Graf, 1986). 

Des recherches ont ete entreprises afin de permettre une meilleure digestibilite de 
la phytine et de Tacide phytique chez les animaux monogastriques. De nombreux travaux se 
sont portes principalement sur les phosphatases ou d'autres types d' enzymes intervenant dans 
la mobilisation de la phytine. Par exemple, des genes codant pour des phytases de cereales ont 
15 ete isoles. L'identification des genes Phyt I et Phyt 11, provenant du mais a ainsi perniis 
d'obtenir des plantes de mais presentant une teneur accrae en phytase (WO 98/05785). 

Les auteurs de la presente invention, quant a eux, se sont interesses a une autre 
famille d'enzymes, qui ne pr^sentent pas d'homologie significative avec Phyt I ou Phyt 11 : les 

20 MIPP - Multiple Inositol Polyphosphate Phosphatases, apparentees aux histidine phosphatases 
repertoriees uniquement dans le regne animal. EUes jouent un rdle important daas les 
processus d'ossification, notamment dans le developpement et la diff6renciation des 
chondrocytes (Romano et al, 1998). Ces phosphatases sont egalement connues comme etant 
les seules enzymes animales qui hydrolysent les molecules d'inositol-tetra;, -penta- et - 

25 hexaphosphate (Chi et al , 1 999). 

Alors que ces enzymes etaient jusqu'alors reconnues comme specifiques de 
I'espece animale, les auteurs de la presente invention sont parvenus a caracteriser des 
sequences d'acides nucleiques de plantes presentant une homologie significative avec les 
genes codant pour les MIPP animales. Aussi les enzymes cod6s par ces acides nucleiques de 

30 plantes seront par la suite appelees MIPP vegetales. 

La phytine, un substrat privilegie pour les MIPP, libdre ainsi du phosphate 
inorganique ainsi que les cations chelates. Le phosphate inorganique et les differents cations 
liberes sont alors disponibles pour les voies metaboliques qui les requierent. 
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La presente invention a done pour objet \m acide.nucleique isole codantpour nne 
enzyme MIPP vegetale a activite phytasique. Les enzymes MIPP des cereales sent 
particulierement visees, en particulier celles du mais, du riz et du ble. L'invention a plus 
particulierement pour objet un acide nucleique isole comprenant une sequence choisie parmi 
SEQ ID n^ 1 (ADNc de mais), SEQ ID n°3 (ADNc de riz) ou SEQ ID 17 (ADNc de mais). 

De maniere preferentieUe, rinvention a pour objet un acide nucl6ique isole 
comprenant la sequence SEQ ID n° 17 ou une sequence homologue a la sequence SEQ ID n° 
17. 

Les sequences complementaires de ces sequences d'acides nucl^iques font 
egalement partie de la presente invention. 

L'invention a egalement pour objet, des fragments des sequences ci-dessus codant 
pour des peptides conservant Tactivite mentionnee, ou les sequences complementaires de ces 
fragments. 

L'invention conceme aussi les sequences homologues des sequences mentiormees 

plus haut. 

Le terme ''homologue" fait reference a tout acide nucleique presentant une ou 
plusieurs modification(s) de sequence par rapport k tout ou partie d'xme sequence donnee. 

Ces sequences homologues sont, de maniere preferentieUe, definies comme: 

i) des sequences similaires a au moins 70 % de la sequence SEQ ID n'' 1, n*^ 3 ou 
n*^ 17, de preference au moins 80%, de preference encore au moins 90%; ou 

ii) des sequences hybridant avec la sequence SEQ ID n° 1, n° 3 ou n°17, ou sa 
sequence complementaire, dans des conditions stringentes d'hybridation, ou 

iii) d€s sequences codant pour une enzyme MIPP vegetale comprenant la sequence 
d*acides amines SEQ ID -n^l, n°4 ou rf 18, ou une sequence d'acides amines homologue. 

De maniere preferentieUe, une telle sequence nucleotidique homologue hybride 
specifiquement aux sequences complementaires de la sequence SEQ ID n° 1, n° 3 ou n° 17 
dans des conditions stringentes. Les parametres definissant les conditions de stringence 
dependent de la temperature a laquelle 50% des brins apparies se separent (Tm). 

Pour les sequences comprenant plus de 30 bases, Tm est definie par la relation : 
Tm==81,5-f0,41(%GH-C)+16,6Log(concentration en cations) - 0,63(%fonnamide) - 
(600/nombre de bases) (Sambrook et aL, 1989). 

Pour les sequences de longueur inferieure a 30 bases, Tm est definie par la 
relation : Tm= 4(G+C) + 2 (A+T). 
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Dans des conditions de stringence appropriees, auxquelles les sequences 
aspecifiques n'hybrident pas, la temperature d'hybridation pent etre de preference de 5 a lO'^C 
en dessous de Tm, et les tampons d'hybridation utilises sont de preference des solutions de 
force ionique elevee telle qu'une solution 6xSSC par exemple. 

Le terme "sequences similaires" employe plus haut se refere a la ressemblance 
parfaite ou identite entre les nucleotides compares mais aussi k la ressemblance non parfaite 
que Ton qualifie de similitude. Cette recherche de similitudes dans les sequences nucleiques 
distingue par exemple les purines et les pyrimidines. 

Une sequence nucleotidique homologue k VORF representee a la SEQ ID n° 1, n° 
3 ou n° 17 inclut done toute sequence nucleotidique qui diff^e de la sequence SEQ ID n° 1, 
n° 3 ou n"" 17 par mutation, insertion, deletion ou substitution d*une ou plusieurs bases, ou par 
la degen^rescence du code genetique, pour autant qu'elle code poxu un polypeptide presentant 
Tactivite phytasique de la MEPP vegetale. 

Parmi de telles sequences homologues, sont comprises les sequences des genes de 
cereales autres que le mais ou le riz, ainsi que les variants alleliques. 

La presente invention a egalement pour objet un polypeptide isole, denomme . 
MIPP vegetale, comprenant de preference la sequence d'acides amines SEQ ID n*^ 2, n° 4 ou 
n° 18. Plus particulierement, le polypeptide comprend la sequence d'acides amines SEQ ID n° 
18. II est entendu que sont egalement comprises les sequences homologues, definies de 
maniere avantageuse comme 

i) les sequences similaires a au moins 70% de la sequence SEQ ID n° 2, n° 4 ou 
18, de preference au moins 80%, de preference encore au moins 90%; ou 

ii) les sequences codees par une sequence d'acide nucleique homologue telle que 
defmie precedemment c'est-a-dire une sequence d'acide nucleique hybridant avec la sequence 
SEQ ID n° 1, n*^ 3 ou n° 17 ou sa sequence complementaire, dans des conditions sttingentes 
d'hybridation. 

La encore, le terme "similaires" se refere a la ressemblance parfaite ou identite 
entre les acides amines compares mais aussi k la ressemblance non parfaite que Ton qualifie 
de similitude. Cette recherche de similitudes dans une sequence polypeptidique prend en 
compte les substitutions conservatives qui sont des substitutions d'acides amines de mgme 
classe, telles que des substitutions d' acides amines aux chaSnes laterales non chargees (tels 
que Tasparagine, la glutamine, la serine, la threonine, et la tyrosine), d'acides amines aux 
chaines laterales basiques (tels que la lysine, Targinine, et Thistidine), d'acides amines aux 
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. chaines laterales acides (tels que Tacide aspartique et Tacide glutamique) ; d'acides amines 
aux chaines laterales apolaires (tels que la glycine, I'alanine, la valine, la leucine, Tisoleucine, 
la proline, la phenylalanine, la methionine, le tryptophane, et la cysteine). 

Plus generalement, par « sequence d' acides amines homologue », on entend done 
toute sequence d 'acides amines qui differe de la sequence SEQ ID n° 2, 4 ou n° 18 par 
substitution, deletion et/ou insertion d'un acide amin6 ou d'un nombre r6duit d'acides amines, 
notamment par substitution d'acides amines naturels par des acides amines non naturels ou 
pseudoacides amines a des positions telles que ces modifications ne portent pas 
significativement atteinte a Tactivite biologique de la MIPP vegetale. 

L'homologie est g6neralement determinee en utilisant un logiciel d'analyse de 
sequence (par exemple, Sequence Analysis Software Package of the Genetics Computer 
Group, University of Wisconsin Biotechnology Center, 1710 University Avenue, Madison, 
WI 53705). Des sequences d'acides amines similaires sont aUgnees pour obtenir le maximum 
de degre d'homologie (i.e. identite ou similitude, comme defini plus haut). A cette fm, il pent 
etre necessaire d'introduire de maniere artificielle des espaces (« gaps ») dans la sequence. 
Une fois Talignement optimal realise, le degre d'homologie est etabh par enregistrement de 
toutes les positions pour lesquelles les acides amines des deux sequences comparees sont 
identiques, par rapport au nombre total de positions, 

"Uactivite biologique de la MIPP v6getale" se refere notamment k son activate 
phjrtasique, qui pent Stre determinee par le dosage du phosphate Ubere par Tenzyme k partir 
de phytate de sodium. 

Le polypeptide de la presente invention pent Stre synthetise par toutes les 
methodes bien connues de Thomme du metier. Le polypeptide de Tinvention pent par exemple 
etre synthetise par les techniques de la chimie de synthese, telles que la synthese de type 
Merrifield qui est avantageuse pour des raisons de purete, d' absence de produits secondaires 
non desires et pour sa facilite de production. 

Une proteine recombinante pent egalement etre produite par un precede, dans 
lequel un vecteur contenant un acide nucleique selon VinvQntion, tel qu'im acide nucleique 
comprenant la sequence SEQ ID n° 1, n^ 3 ou n° 17 ou une sequence homologue est transfere 
dans une cellule h6te procaryote ou eucaryote qui est mise en culture dans des conditions 
pennettant Texpression du polypeptide correspondant La prot6ine produite pent ensuite gtre 
r6cuperee et purifiee. Les precedes de purification utilises sont connus de Thomme du metier. 
Le polypeptide recombinant obtenu pent Stre purifie a partir de lysats et extraits cellulaires, du 
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sumageant du milieu de culture, par des methodes utilisees individuellement ou en 
corabinaison, telles que le firactionnement, les methodes de chromatographies etc. 

La presente invention a done egalement pour objet une methode de production de 
proteine MIPP vegetale, caracterisee en ce qu'elle comprend les etapes de : 

a) transformation d'une cellule, en particulier d'un vegetal ou d'un 
n:iicroorganisme, avec une cassette d' expression comportant des sequences regulatrices 
capables de commander i'expression d'une quantite accrue de MIPP dans ladite cellule hdte ; 

b) eventuellement culture de ladite cellule h6te ou, dans le cas ou cette cellule 
hdte est une cellule vegetale, croissance de la plante transformee ; 

c) extraction de la proteine MIPP de la culture cellulaire ou de la plante 
transform6e. 

La presente invention a done aussi pour objet une cassette d'expression 
caracterisee en ce qu'elle comporte au moins une des sequences ou fragments d'acide 
nucleique tels que definis precedemment, place sous le contr61e d'au moins ime sequence 
regulatrice capable de commander T expression de la proteine MIPP vegetale. 

Parmi ces sequences regulatrices, on pent citer les promoteurs, les activateurs et 
les introns et les terminateurs de transcription. 

Un grand nombre de promoteurs sont utilisables pour la transformation des 
plantes selon la presente invention. A titre d'exemple on pent citer : 

- des promoteurs permettant une expression constitutive : 

- promoteur p35S (Kay et al., 1987) 

- promoteur pUbil du gene codant pour Fubiquitine 1 de mais (Christensen et al , 
1992) 

- promoteur pActl du gene codant I'actine 1 de riz (Mc Elroy et al, 1991) 

- promoteurs des histones (EP 0 507 698) 

- promoteur CsVMV du virus de la mosaique de la nervure du manioc (Verdaguer et al, 
1996, 1998) 

- les promoteurs specifiques d'un organe ou d'un tissu de la plante, et plus particulierement 
les promoteurs specifiques des grains (Datla et al, 1997), conrnae les promoteurs de genes 
codant pour des proteines de reserve telles que : une glutenine de masse mol6culaire elevee 
HMWG (High Molecular Weight Glutenin) de ble ou d'orge specifique de I'albumen (Roberts 
et al, 1989 ; Anderson O.D. et al, 1989), la napine, la phaseoline, I'heHanthinine, 1' albumine, 
Foleosine, GEAl et GEA6 d'Arabidopsis thaliana (Gaubier et al, 1993), la y-zeine de mais, 
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le promoteur du gene pHyPRP codant pour une proteine hybride riche en proline de mais 
(HyPRP : Hybrid Proline Rich Protein) qui est specifique de Tembryon et plus 
particulierement du scutellum (Jose-Estanyol et al, 1992), le promoteur Vpl du gene 
Viviparousl (activateur de transcription - Mo Carty D.R et al (1989)) combin6 au premier 
intron Sh du gene Shrunken (Maas et al (1991)), qui est specifique de Taleurone. 

- des promoteurs inductibles : 

- lors d'un stress hydrique (Kasuga et al, 1999) 

- par la lumiere : promoteur du gtoe codant pour la petite sous imite de la RUBISCO, 
Ribulose 1,5 BISphosphate Carboxylase Oxygenase, promoteur du gene codant pour 
la chlorophylle a/b, 

- des promoteurs des genes codant la mannopine synthase, la nopaline synthase, Toctopine 
synthase d'Agrobacterium tumefaciens, 

- des promoteurs de genes codant pour des enzymes choisis de preference parmi ceux-ci : 
I'alcool dehydrogenase 1 (Adhl) de mais, la phenylalanine ammonia lyase (PAL), la 
HMG-CoA reductase (HMG), la chitinase, la glucanase, les inhibiteurs de proteases, les 
genes de la famille PRl, le gene vspB (US 5,670,349), HMG2 (US 5,670,349), la beta- 
galactosidase (Abgl) de pomme, ou ramino-cyciopropane carboxylate synthase (WO 
98/45445). 

Amsi, Texpression ectopique tissu-specifique ou organe-specifique permet la 
production de graines riches en phosphate inorganique ou enrichies en prot6ine MIPP 
capables de degrader la phytine tout en limitant les dommages physiologiques eventuels dus a 
une variation de la teneur en phytine, 

De maniere generale, on utiUsera pr6ferentiellement un promoteur constitutif tel 
que le promoteur pAct 1 du gene Act 1 de riz contenu dans le plasmide pActl-F4 (Mc Elroy 
et al, 1991) ou le promoteur p35S (Kay et al, 1987), ou un promoteur tissu specifique 
comme le promoteur HMWG de ble ou d'orge, ou encore le promoteur pCRU du gene de la 
cruciferine de radis, qui pennettent tons trois une expression de la proteine d'interet dans les 
graines (Roberts et al., 1989 ; Anderson O.D. et al., 1989 ; Depigny-This et a/,, 1992). 

Conformement a I'invention, des elements comme les activateurs et les introns 
peuvent egalement dtre inseres dans la cassette d'expression dans le but d'amplifier 
Texpression du gene d'interSt. 

Un exemple d'activateur est Tactivateur de la traduction du virus TEV (Tobbaco 
Etch Virus) decrit par Carrington et Freed (1990). Panni les introns utilisables, le premier 
intron du ghne AdhlS de mais, qui pent etre place entre le promoteur et la sequence codante. 
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Get intron lorsqu'il est inclu dans une construction genetique, augmente T expression de la 
proteine desiree dans les cellules de mais (Callis et al, 1987). Onpeut aussi utiliser le premier 
intron du gene shrunken 1 de mais (Maas et al, 1991), le premier intron du gene de la 
catalase du pois, CAT-1 (Olita et a/., 1990), le second intron du gene ST-LSl de pomme de 
terre (Vancanneyt et aL, 1990), rintron du gene TobYDV du virus 'yellow dwarf (Morris et 
al, 1992), rintron du gene Act 1 codant I'actine 1 du riz (Mo Elroy et al, 1990) ou encore 
I'intron 1 du gene codant pour la triosephosphate isomerase (Snowdon et al., 1996), 

De maniere avantageuse, la cassette d'expression pent aussi contenir des 
sequences 5' non traduites dites 'leaders'. De telles sequences peuvent augmenter la 
traduction. Parmi celles connues de Thomme du metier, on pent citer : 

- le leader EMCV (EncephaloMyoCarditis Virus 5' noncoding region) (Elroy-Stein et al^ 
1989), 

- le leader TEV (Tobacco Etch Vims) (Carrington and Freed, 1990), 

- le leader du gene BiP codant pour la proteine de liaison a la chaine lourde de 
Vimmuno^ohuXinQ humaine (Macejack et al, \99l\ 

- le leader AMV RNA 4 provenant de 1' ARNm de la proteine du virus de la mosalque de la 
luzeme(Joblinge^a/. 1987), 

- le leader du virus de la mosalque du tabac (Gallie et aL, 1989), 

Parmi les terminateurs utilisables dans les constructions de Tinvention, on pent 
citer notamment : 

- le polyA 35S du virus de la mosaaque du chou-fleur (CaMV), decrit dans rarticle de 
Franck etal (1980), 

- le terminateur nos correspondant h la region 3' non-codante du gene de la nopaline 
synthase du plasmide Ti Agrobacterium tumefaciens (Depicker et aL, 1992), 

- le terminateur du gene histone (EP 0 633 3 17), 

Selon un mode de realisation preferee, le terminateur de transcription est le 
terminateur nos du gene de la nopaline synthase d'Agrobacterium tumefaciens (Depicker et 
aL, 1992) ou alors la sequence polyA 35S du virus de la mosaique de chou-^fleur (CaMV), 
decrit dans Tarticle de Franck et aL (1980). 

Dans une variante de realisation de I'invention, lesdites sequences r^gulatrices 
compreiment egalement des signaux d'adressage capables de diriger Texpression 
specifiquement dans un type particulier de compartiment cellulaire, par exemple I'espace 
extracellulaire ou Tapoplasme. 
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Comme exemple de signaux d'adressage ehloroplastiques, on pent citer la 
sequence codant pour le peptide transit du precurseur de la petite sous-unite de la ribulose 1,5- 
bis-phosphate carboxylase oxygenase do Pisum sativum. Comme signaux d'adressage 
mitochondrial, on peut citer la sequence codant pour le peptide transit du precursexor de la 
sous-.unit6 p de TATP-ase Fl mitochondriale de Nicotiana plumbaginifolia. 

Ces peptides transits, comprenant la methionine N-termiuale, sont normalement 
clives dans les chlproplastes ou les mitochondries. L'expression des proteines dans ces 
organites a done egalement la caracteristique de produire une mol6cule depourvue de la 
methionine N-terminale conmae la molecule naturelle. 

Selon une autre variante, les sequences d'adressage peuvent etre des sequences 
codant pour un peptide signal N-terminal ("prepeptide"), eventuellement en association a un 
signal responsable de la retention de la proteine dans le reticulum endoplasmique (signal du 
type KDEL ou KTEL), ou un signal d'adressage vacuolaire ou "propeptide". La presence du 
peptide signal N-terminal ou propeptide permet Tintroduction du neopolypeptide dans le 
reticulum endoplasmique oti ont lieu un certain nombre de modifications post- 
traductionnelles, notamment le clivage du peptide signal, les N-glycosylations, si la prot6ine 
en question presente des sites de N-glycosylation, et la formation des ponts disulfures. Paxmi 
ces diff6rents signaux, le propeptide, responsable de I'adressage de la proteine dans le 
reticulum endoplasmique, est tres utile. II s'agit normalement d'un peptide signal N-terminal 
hydrophobe ayant entre 10 et 40 acides amines et etant d'origine animale ou vegetale. De 
preference, il s'agit d'un propeptide d'origine vegetale, par exemple celui de la sporamine, de 
la lectine d'orge, de Textensine vegetale, de la proteine PRl ou PR2. 

Normalement, le peptide signal est clive par une signal-peptidase des 
rintroduction co-traductionnelle du neopolypeptide dans la lumiere du RER (Reticulum 
Endoplasmique Rugueux). La proteine mature ne comporte plus cette extension N-terminale. 

Pour obtenir la secretion, selon un mode de realisation de Tinvention, on peut par 
exemple utiliser le peptide signal de la sporamine A des racines tuberisees de la patate douce. 

Les sequences d'adressage peuvent, outre le propeptide, comporter aussi un signal 
de rOtention endoplasmique, consistant en les peptides KDEL, KTEL, SEKDEL ou HEKDEL. 
Ces signaux se trouvent normalement k TextrOmitO C-terminale de la proteine et peuvent 
subsister sur la proteine mature. La prOsence de ce signal a tendance a augmenter les 
rendements en proteines recombinantes. 

La prOsence de sequences de type KDEL ou KTEL a I'extrOmitO C-terminale des 
protOines conduit a la retention de celles-ci dans le reticulum endosplasmique et done a une 



wo 02/00890 PCT/FROl/02116 

10 

compartimentalisation cellulaire de ces proteines, Cette compartimentalisation peut dans 
certains cas bloquer Taccessibilite de 1' enzyme a son substrat present dans un compartiment 
cellulaire different, conduisant a une inactivite de la proteine. Ainsi, selon une variante, il est 
possible d'envisager T elimination de ce type de sequences d'adressage sans perdre Tactivite 
enzymatique de la proteine. L' elimination de ces sequences peut conduire a une expression 
apoplastique de la proteine pouvaut permettre une meilleure accessibilite de la proteine a son 
substrat. L'elimination peut conduire aussi k une expression de la proteine dans un autre 
compartiment que celui ou s'exprime son substrat, evitant ainsi une degradation rapide de 
Tacide phytique susceptible d*alterer le developpement de la graine. 

L'activit6 de Tenzyme vis-a-vis de son substrat peut done 8tre contr61ee dans 
Tespace et dans le temps. Eventuellement, une etape ulterieure de broyage de la graine peut 
etre mise en oeuvre pour permettre a Tenzyme d'acceder a son substrat. 

L'elimination de la sequence KTEL ou KDEL peut etre realisee notaxnment pax la 
technique d' amplification par PGR en utilisant des amorces specifiques de la partie C- 
terminale de la proteine juste en amont de la sequence KTEL ou KDEL et en ajoutant sur 
r amorce un codon stop. 

Les signaux d'adressage peuvent, outre le propeptide, comporter aussi un signal 
d'adressage vacuolaire ou "propeptide". En presence d'un tel signal, apres passage dans le 
RER, la proteine est adress6e aux vacuoles des tissus aqueux, par example les feuilles, ainsi 
qu'aux corps proteiques des tissus de reserve, par example les graines, tubercules et racines. 
L'adressage de la proteine vers les corps prot&ques de la graine est particulierement 
int6ressant en raison de la capacite de la graine k accumuler des proteines, jusqu'a 40 % des 
proteines par rapport a la matiere seche, dans des organites cellulaires derives des vacuoles, 
appeles corps proteiques et en raison de la possibilite de stocker plusieurs annees les graines 
contenant les proteines recombinantes a Tetat deshydrate. 

Comme propeptide, on peut utiliser un signal d'origine animale ou vegetale, les 
signaux vegetaux etant particulierement preferes, par exemple la pro-sporamine. Le 
propeptide peut etre N-terminal ("N-terminal targeting peptide" ou NTTP), ou C-terminal 
(CTTP). Dans la mesure ot les propeptides sont normalement clives des T entree de la 
prot6ine dians la vacuole, ils ne sont pas pr6sents dans la proteine mature. 

L'utilisation du peptide signal ou propeptide peut conduire a la glycosylation de la 

proteine. 

En Tabsence de tout signal d'adressage, la proteine est exprimee dans le 
cytoplasme. 
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L'invention se rapporte aussi a un vecteur dans lequel est inseree la cassette 
d'expression telle que definie ci-dessus. Ce vecteur peut etre un plasmide qui peut en outre 
comprendre un gene marqueur permettant de distinguer une plante transformee d'une plante 
qui ne contient pas TADN etranger transfere. Ainsi, confonnement a Tinvention, le vecteur 
5 peut inclure comme gene marquexur, aussi bien des genes de selection qui confSrent une 
resistance a un antibiotique ou a un herbicide, que des genes rapporteurs. Parmi les g^nes de 
selection utilisables, on peut citer : 

" le gene sul conf6rant la resistance a Therbicide sulfonamide Asulam (WO 98/493 16), 

- le g^ne nptll conferant la resistance a la kanamycine (Sevan et al, 1983), 

10 - le gene hph conferant la resistance a Thygromycine (Herrera-Estrella et ah, 1983), 

- le gene bar conferant la tolerance au bialaphos (White et ah, 1990), 

- le gene EPSPS conferant la tolerance au glyphosate (US 5,188,642), 

- le gene HPPD conferant la tolerance aux isoxazoles (WO 96/38567), 

- le gene de la chloramphenicol acetyl transferase (CAT) qui detoxifie le chloramphenicol. 
15 De meme, on peut citer comme genes rapporteurs : 

- le gene codant pour Tenzyme p-glucuronidase (GUS), 

- le gene de la proteine de fluorescence verte GFP qui permet de visualiser, sous UV, les 
cellules trahsformees, 

Conform6ment a Tinvention, comme vecteur de clonage ou d' expression 
20 comprenant le fragment, on peut citer les vecteurs comprenant une sequence d'ADN 
contenant au moins ime origine de replication telle que des plasmides, des cosmides, des 
bact6riophages, des virus etc... Les plasmides sont neanmoins preferes. 

L'invention conceme aussi les botes cellulaires, notamment bacteriens, contenant 
25 les vecteurs ci-dessus mentionnes. 

L'invention propose egalement un precede de production de plantes transgeniques 
comprenant, entre autres, les etapes de : 

transformation de cellules de plante avec un vecteur d'expression contenant un 
30 fragment d'acide nucl6ique de la presente invention, 
selection des cellules transformees, 

generation des plantes transformees k partrr de ces cellules, exprimant le 
fragment d'acide nucl6ique insere. 
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La transformation des plantes selon Tinvention pent etre realisee par differentes 
methodes, connues de rhomme du metier. On pent citer, tout d'abord, les methodes de 
transfert direct de genes telles que la micro-injection dans des cellules d'embryon de la plante 
(Neuhaus et Coll., 1987) ou Telectroporation (Chupeau et ColL, 1989), la precipitation directe 
5 avec le polyethyleneglycol (Schocher et Coll., 1986) ou le bombardement par canon a 
particules (Mc Cabe et Coll., 1988). 

On pent aussi infecter la plante par une souche bacterienne notamment 
d'Agrobacterium tumefaciens selon une methode eprouvee (Schell et Van Montagu, 1983) ou 
d^Agrobacterium rhizogenes notamment pour les especes recalcitrantes a la transformation 
10 (Chilton et Coll., 1982). La souche bacterienne pent comporter le gene codant pour ?enzyme 
MIPP vegetale, sous le contr61e d'elements assurant Texpression dudit g^ne. La souche 
bacterienne pourra Stre transformee par im vecteur dans lequel est inseree une sequence 
codant ladite enzyme sous le controle d'elements assurant son expression. Cette sequence est 
inseree par exemple dans un vecteur binaire tel que pBIN19 (Bevan, 1984) ou pMON 505 
15 (Horsch et Klee, 1986) ou tout autre vecteur binaire derive des plasmides pTi et pRi. EUe pent 
aussi etre utilement introduite par recombinaison homologue dans un plasmide pTi ou pRi 
desaime, tel que pGV 3850 (Zambryski et Coll., 1983) avant la transformation de la plante. 

II a ete montre recemment que des plantes monocotyledones telles que le riz et le 
mals pouvaient 6tre avantageusement transformees par Agrobacterium tumefaciens (Hiei et al 
20 1994, Ishida et al, 1996). 

Selon une methode preferee de I'invention, les fragments d'acides nucleiques sont 
introduits dans les cellules par bombardement de particules recouvertes par lesdits fragments. 
Le bombardement de particules offre Tavantage d'une transformation rapide. Generalement 
les embryons immatures ne subissent qu'un unique bombardement. Toutefois xm 
25 bombardement repete peut augmenter la frequence de transformation (WO 98/49316), 

Apres I'etape de transformation, les cellules transformees sont selectionnees selon 
les marqueurs phenotypiques utilises dans le vecteur, Cette selection s'effectue sur un milieu 
Nontenant un agent selectif approprie. Les cellules transformees ainsi selectionnees sont alors 
cultivees et les plantes sont r6g6nerees. Une extraction d'ADN et un Southern blot avec des 
30 sondes specifiques du gene d'interet permettent de confirmer la transformation. Les methodes 
permettant d'isoler I'ADN a partir de materiels biologiques en culture et de verifier la 
presence de Tinsert sont bien coimues de Thomme du metier, elles sont, entre autres, decrites 
par Southern et al, 1975 et MuUis et al, 1987. 
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La presente invention a plus particulierement pour objet un precede pour accroitre 
I'activite phytasique d'une plante, caracterise en ce qu'on induit une surexpression d'une 
MIPP, plus particulierement de mais, de riz ou de ble, dans ladite plante a I'aide d'une 
cassette d' expression telle que decrite auparavant et selon le procede precedent. 

On entend ici par "surexpression" aussi bien une augmentation du taux de MIPP 
par rapport au taux exprime dans une plante normale, qu'une expression ectopique de cette 
enzyme, dans un tissu ou im compartiment et/ou k un stade de developpement ou celle-ci n'est 
normalement pas exprimee. 

Confoimement k la presente invention, la sequence etrangere pent etre 
heterologue, c'est-i-dire qu'elle provient d'une plante diff6rente de la cellule hote. H pent 
aussi s'agir d'une sequence de la MIPP naturellement produite par la plante. 

La presente invention a egalement pour objet des botes vegetaux, consistant en 
des plantes ou organes vegetaux, transformes avec un ou plusieurs acides nucleiques de 
rinvention et selon le procede defini ci-dessus. Si la transformation implique plusieurs genes 
d'interet, alors ceux-ci peuvent etre inseres dans une meme cassette d' expression ou alors 
dans des cassettes d'expression differentes. 

Le terme de *h6tes vegetaux' englobe aussi bien les plantes que les cellules de 
plantes ou les differentes parties de la plante, telles que semence, firuit ou feuille. 

On pent citer, comme exemples de plantes transg6niques selon Tinvention, les 
c6reales, notamment le mais, le ble, Torge, le sorgho, le seigle, le riz, preferentiellement le 
mais, ainsi que le pois, le soja et la pomme de terre. 

Ces plantes transgeniques de Tinvention englobent aussi bien les plantes de 
premiere generation, que levirs descendants (lignees ou hybrides, notamment). 

La presente invention a plus particulierement pour objet des botes vegetaux 
transgeniques dans lesquels une MIPP vegetale, plus particulierement de mai's, de ble ou de 
riz, pent etre exprimee dans une partie de la plante ou un compartiment cellulaire ou cette 
enzyme n'est pas produite naturellement ou seulement en faibles quantites. Ces botes 
vegetaux sont caracterises par un g6nome dans lequel on a introduit une cassette d' expression 
selon rinvention comportant des sequences regulatrices qui induisent une expression 
specifique dans ladite partie de la plante ou ledit compartiment cellulaire, L'h6te vegetal en 
question est avantageusement une cereale et plus avantageusement encore le mals, le ble et le 
riz, ou leurs organes. 
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La presente invention conceme plus precisement une plante transgenique, selon ■ 
I'invention, caracterisee en ce qu'elle produit des semences transgeniques exprimant une 
quantite accrue d' enzymes a activite phytasique. 

La presente invention comprend egalement les semences de cette plante 
5 transgenique et notamment les semences coiiiportant une teneur en MIPP vegetale accrue, 
obtenue par expression sp6cifique d'une des sequences d'acide nucleique selon la presente 
invention, dans la semence. 

Par ailleurs, la farine et tout produit susceptible d*8tre obtenu a partir de cette 
semence font aussi partie de Tinvention, 
10 Enfin, la presente invention a pour objet une composition pour Talimentation 

humaine ou animale comprenant des semences, une farine de semences ou une MIPP 
vegetale, produites selon la presente invention. 

Selon im mode de realisation, les acides nucleiques definis par I'invention peuvent 
15 etre utilises comme marqueur du phenotype lie a Texpression de proteines MIPP. 

L'invention permet I'utilisation des fragments nucleotidiques comme marqueurs 
moleculaires dans des programmes de culture, notamment dans la selection de varietes 
exprimant une proteine MIPP ou ime plante transformee avec une sequence codant pour cette 
MIPP. 

20 Selon la presente invention, ces sequences pennettent Tobtention des ADN 

genomiques par des methodes connues de I'honmie du metier, par exemple par le criblage de 
banques genomiques suivant les indications de Sambrook et al (1989, Molecular cloning : a 
laboratory manual, Cold Spring Harbor Laboratory Press, New York). De meme au moyen de 
sondes degenerees elles permettent T identification de genes codant pour des proteines 

25 homologues aux MDPP vegetales. 

Les plantes transgeniques exprimant la MIPP vegetale selon I'invention ou 
Tenzyme elle-meme peuvent etre utilisees a des fins variees, dans toute situation ou T activite 
phytasique de cette enzyme est n6cessaire ou d6siree. 
30 La MIPP vegetale est ainsi utile dans les precedes de preparation alimentaire ou 

dans les procedes d'extraction de ramidon (procede de trempage). Par exemple, avec cette 
enzjnne, il est possible d'augmenter Textractibilite des amidons des grains ou elle s'exprime. 
Le phytate fait pr^cipiter les proteines avec Tamidon de sorte que si Ton reduit le taux de 
phytate, I'extraction de Tamidon s'en trouve facilitee. L'ajout d'une enzyme a activity 
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phytasique aux grains de plantes a partir desquels on souhaite extraire Tamidon permet de 
pallier la precipitation des proteines par les phytates. 

Une plante transformee avec une sequence codant pour une MIPP vegetale selon 
le procede defini par Tinvention, ou une partie de celle-ci, peut Stre utilisee pour atn61iorer la 
digestibilite du phytate, dans la ration alimentaire d'animaux monogastriques, et par 
consequent, reduire le taux de phytate dans le fumier ou lisier. 

L'activite phytasique de la MIPP veg6tale peut 8tre egalement mise a profit pour 
valoriser les eaux de trempage recuperees ou les eaux de brassage, lors de preparations 
alimentaires. En particulier, la disponibilite accrue du phosphore rend ces eaux tres utiles 
coimne additifs pour milieux de culture ou supports de fermentation. 

En outre, Tactivite phytasique generee permet xme meilleure recuperation de 
rinositol et de ses derives a partir des eaux de trempage ou de brassage. 

L'invention conceme egalement Tutilisation d'une MIPP vegetale selon 
rinvention ou Tutilisation de tout ou partie de plantes contenant une MIPP selon Tinvention, 
a des fins therapeutiques ou dietetiques, notamment pour la production de myo-inositol et/ou 
pour la diminution de Tacide phytique. 

L'acide phytique a ete tenu pour responsable de certains impacts sur la sante 
himiaine tels que la malformation des os, Tosteosporose et les anemies causees par des 
carences en fer, ou des interferences avec Tassimilation du calcium, du magnesium et du zinc 
(Berlyne et aL, 1973; Shan et al., 1979). 

Le myo-inositol, forme nutritionnelle active de T inositol, est un constituant du 
phospholipide phosphatidylinositol. II est connu pour ses vertus dans le domaine de la sante. 
On lui a souvent attribue des effets sur la diminution de la concentration des triglycerides et 
du cholesterol dans le sang, et plus generalement pour la protection contre les maladies 
cardiovasculaires. De plus, il est reconnu que les composes issus d'un phospholipide tel que le 
myo-inositol ont des effets benefiques sur I'insomnie et Taoxiete, Par ailleurs, la nevropafliie 
peripherique du diabetique est une des complications les plus paralysantes du diabete. Or, on 
suppose depuis deja plusieurs annees qu'une diminution du taux de myo-inositol est associee 
aux degats des fibres nerveuses des diabetiques souffrant d'lme telle complication. 

L'invention conceme enfin I'utilisation de la MIPP vegetale, selon Tinvention, 
pour liberer le phosphate inorganique directement assimilable par les monogastriques 
(Pointillard, 1994) et/ou ameliorer la disponibilite des cations chelates par la phytine tels que 
le fer, le calcium, le magnesium ou le zinc. Ceci evite des ajouts de complements dans les 
rations animales et permet d'augmenter la valeur nutritive de la graine. 
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LEGENPES PES FIGURES 

La Figure 1 represente un alignement des sequences nucleiques codant pour les 
5 MIPP de mais et de riz. 

La Figure 2 represente un alignement des sequences proteiques de MIPP de riz et de 

mais. 

La Figure 3 repr6sente une comparaison des sequences d'acides amines des MIPP de 
riz et de mai's avec des MIPP animales, des phophatases acides et des phytases fongiques 
10 La Figure 4 est une carte de restriction du plasmide pRD-257. 

La Figure 5 est une carte de restriction du plasmide p3214. 

La Figure 6 est une carte de restriction du plasmide pBIOS 421. 

La Figure 7 est une carte de restriction du plasmide pBIOS 422. 

15 LISTE DES SEQUENCES 

SEQ ID N°l : Sequence nucleique d'ADNc isole de mais 

SEQ ID N°2 : Sequence d' acides amines d'une proteine MIPP de mais (ZmMIPP) 
SEQ ID N°3 : Sequence nucleique d' ADNc isole de riz 

SEQ ID N°4 : Sequence d'acides amines d'une proteine MIPP de riz (OsMCPP) 
20 SEQ ID N°5 : Oligonucleotide 5'olZMPl utilise comme amorce 5' pour Fobtention de 
r ADNc ZmMIPP. 

SEQ ID N°6 : Oligonucleotide 3'olZMP utilise comme amorce 3' pour I'obtention de I'ADNc 
ZmMIPP. 

SEQ ID N°7 : Oligonucleotide inteme oMIPPl. 
25 SEQ ID N^8 : Oligonucleotide interne oIMIPP2. 

SEQ ID N°9 : Oligonucleotide 5'olOSP utilise comme amorce 5' pour I'obtention de I'ADNc 
OsMIPP. 

SEQ ID N°10 : Oligonucleotide 3'olOSP utilise comme amorce 3' pOTir I'obtention de 
I'ADNc OsMIPP. 

30 SEQ ID N°n: Oligonucleotide 5'olOSPl utilise comme amorce 5' pour Tobtention de 
I'ADNc OsMIPP. 

SEQ ID N°12 : Oligonucleotide oIMIPP9 utilis6 comme amorce 3' pour I'obtention de 
I'ADNc codant pour une MIPP de ble. 

SEQ ID N°13 : Oligonucleotide oIMIPPlO utilise corome amorce 3' pour I'obtention de 
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? ADNc codant pour ime MIPP de ble. 

SEQ ID N°14 : Sequence nucleique de TEST 3'TaMIPP. 

SEQ ID N°15 : Peptide signal putatif 

SEQ ID N°16 : Peptide signal putatif 

SEQ ID N° 17 : Sequence nucleique d'ADNc isole de mais 

SEQ ID N° 18 : Sequence d'acides amines d'lme proteine MIPP de maYs (ZmMIPP) 



EXEMPLES 

EXEMPLE 1 : Isolement des clones d'ADNc codant pour une proteine MIPP 
vegetale. 

Les sequences de MIPP vegetales peuvent Stre obtenues en realisant me 6tude de 
bioanalyse a partix de sequences codant pour des MIPP animales, presentees par Caf&ey et ah 
(1999). Ces sequences peraiettent ainsi de definir des homologies avec des sequences ADNc 
referencees, par exemple, dans des bases de doimees specifiques au mais, au ble et au riz. En 
identifiant les EST specifiques aux sequences homologues desdites sequences animales, des 
oligonucleotides peuvent alors etre definis et utilises comme amorces pour isoler par PGR ces 
ADNc d'interet a partir de banques d'ADNc ou d'ADNc. 

1-1 - MIPP de maYs (ZmMIPP) 

l.Ll - Choix de la vari6t6 

Deux lignees de Zea Mays ont ete utilisees : la lignee B73 et Thybride Hill (un de 
ses parents etant la Hgnee B73)- L' extraction d'ARN totaux a ete realisee sur des feuilles 
immatures pour la lignee B73 et sur des cals pour I'hybride Hill (Armstrong et al, 1991) 

Conditions de culture 

Feuilles immatures 

40 graines B73 sont mises dans du terreau et placees en serre. Pour la recolte des 
feuilles immatures, on attend le stade ou 7-8 feuilles sont visibles soit environ 3-4 semaines 
en serre. Les feuilles iromatures sont encore dans le comet. Un prelevement a 3 semaines et a 
4 semaines a ete effectue. 

Des feuilles immatures ont et6 egalement prelevees k 2 semaines apres germination. 
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Obtention de cals de type II 

Le prelevement des epis est realise lorsque les embryons immatures ont atteint 
une taille de 1,5 nun a 2 mm c'est k dire 10 jours apres la fecondation. Les epis recoltes sont 
5 debacrasses de leurs spathes et de leurs soies puis sont desinfectes au Domestos® 20% (v/v) 
pendant 15 minutes sous agitation. Les epis sont rinces trois fois a Teau sterile. La partie 
superieure du grain est coupee de fa9on a decouvrir Talbumen, puis une legere pression sur le 
grain permet de degager Talbutnen. L'embryon immature qui se trouve encore dans le grain 
est extrait puis depos6 sur le milieu de callogenese N6P6 (Sels N6 3,98 % (p/v) (Sigma 
10 C1416) ; vitamines N6 5ml/L ; L-proline 0,7 % (p/v) ; hydrolysat de caseine 0,1 % (p/v) ; 
saccharose 20 % (p/v) ; 2,4-D 0,001 % (p/v) ; phytagel 2,5 % (p/v), pH 5,8) en rorientant cote 
plat sur la gelose. Les embryons sont mis en culture pendant 15 jours en chambre de culture a 
26°C et a Tobscurite. Les embryons sont separes de leur radicule puis repiques sur un nouveau 
milieu N6P6. Le cal qui prolifere est repique toutes les 2 a 3 semaines sur milieu N6P6 (boite 
15 de 16 cals). Les cals sont multiplies en chambre de culture a 26 °C et a Tobscurite. 
1.1.2.- Extraction des ARN totaux et synthase des ADNc 

L'extraction des ARN totaux a ete realisee selon la m^thode d^crite par Verwoerd 
etal (1989). 

Pour chaque tissu deux extractions d'ARN totaux ont ete faites. 
20 Pour la synthase du premier brin d*ADNc, les consignes donnees dans le kit 

SMART PGR cDNA synthesis Kit, commercialise par Clontech, ont ete suivies. 

1.1.3- Isolement d'un clone d' ADNc ZmMIPP de mais 

Les oligonucleotides, utilises comme amorces PGR pour le criblage des ADNc 
25 sont presentes en annexe. 

Les oligonucleotides ont ete determines a partir des sequences nucleiques des 
ESTs identifies en bioanalyse comme 6tant fortement homologues aux sequences codant pour 
des MIPP animales. Les oligonucleotides qui encadrent la sequence codante du g^ne 
ZmMIPP, possedent des sites de restriction en 5' : Ncol on Ndel et en 3' : BamBI, ceci pour 
30 permettre le clonage oriente dans le vecteur d' expression bacterien pET-14b (Novagen). Les 
oligonucleotides internes oIMIPPl et olMIPP2 (SEQ ID N° 7 et 8), qui servent a , verifier 
ridentite des sequences, n'en ont pas. 

Amplification PGR 
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La manipulation a ete repetee sur deux pools differents'd'ARN totaux pour une 
meme espece et un meme tissu. 

La reaction d' amplification a ete realisee directement sur le premier brin d'ADNc 
synthetis6 k partir des ARN totaux. 

5 Le couple d'oligonucleotides 5'olZMPl-3'olZMP (SEQ ID N° 5 et 6) sur les 

ADNc de feuilles immatures et de cals a permis Tamplification d'un fragment de 1,6 kb. Sur 
ce fragment, une PGR a ete realisee avec les couples d'oligonucleotides 5'olZMPl-olMIPP2 
(SEQ ID N° 5 et 8), et olMIPPl-3'olZMP (SEQ ID N°7 et 6), olMCPPl et olMIPP2 etant des 
oligonucleotides intemes specifiques de la sequence consensus RHGXRXP, generant 

10 respectivement une amplification k 0,2 kb et 1,4 kb. Ce resultat montre la presence du site 
RHGXRXP dans le fragment de 1,6 kb. Par consequent, il a ete clone dans pGEM-T 
(Promega) et sequence. 



LL4 - Deduction de la sequence d'acides amines et analyse 
15 La sequence d'acide nucleique et la sequence d'acides amines sont presentees en 

annexe, respectivement par SEQ ID N° 1 et SEQ ID N° 2. EUes sont valables pour le clone 
d'ADNc de feuilles immatures et le clone d'ADNc de cals de mais. En effet le sequenfage a 
montr6 qu'elles sont identiques. L' analyse des sequences nucl6otidiques a 6te r6alisee avec le 
logiciel MAC VECTOR™ 6.5.3 - Oxford Molecular, 

20 

Caracteristigues biochuniques de ZmMIPP (par le logiciel MAC VECTOR™ 6.5.3 - Oxford 
Molecular) 

Masse moleculaire calculee 58,6 kDa 

pi 8,95 

25 

Avec les logiciels de detection de motifs proteiques (SEQ WEB version 1.1 - Wisconsin 
Package Genetic Computer Group), identification de : 

- xm peptide signal putatif de 25 acides amines a Textremite N-terminale de la proteine : 

MGMAAPRAPLPLPQLLLLLVAALLA (SEQ.ID N°15) 
30 - un signal de retention putatif dans le reticulum endoplasmique k Textr^mite C-terminale 

de la proteine :KTEL 



1.2 - MIPP de Riz (OsMIPP) 

1.2.1 - Choix de la variete 
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Le materiel vegetal est Oryza sativa Japonica, variete Nipponbare. L' extraction 
d' ARN est realisee a partir de cals de riz. 

Conditions de culture : 

5 Induction des cals de riz. Les grains de riz a maturite sont debarrasses de leurs 

enveloppes extemes, desinfectes 1 min dans Tethanol 70% (v/v) et 30 min dans le domestos 
50% (v/v). Les grains sont rinces dans de Teau distillee sterile et depos6s sur le milieu N6P6 
contenu dans des boltes de Petri. Les boites sont scellees et placees 21 jours dans Fetuve a 
28°C a Tobscurit^. A partir du scutellum de Tembryon, un cal primaire se developpe. Autour 
10 du cal primaire, des petites unites embryogenes s'individualisent, elles sont transferees dans 
des boites de Petri contenant le milieu N6P6 et incubees pendant 14 jours a 28°C et a 
Tobscurite. Pendant cette periode, leur taille va augmenter. Les cals sont ensuite preleves pour 
r extraction d'ARN. 

1.2.2 — Extraction des ARN totaux et synthese des ADNc 

15 L' extraction d'ARN totaux a ete realisee selon la methode decrite par Verwoerd et 

al (1989). 

A partir des cals, deux extractions d' ARN totaux ont ete realisees. 
Pour la synthese du premier brin d'ADNc, les consignes donnees dans le kit 
SMART PGR cDNA synthesis Kit, commerciahse par Clontech, ont ete suivies, 

20 

1 .2.3 - Isolement d'un clone d'ADNc OsMIPP de riz 

Les oligonucleotides utilises ont ete determines a partir des ESTs identifies en 
bioanalyse comme etant fortement homologues aux sequences codant pour des MIPP 
animales. Les oligonucleotides qui devraient encadrer la sequence codante du gene MIPP, 
25 possedent des sites de restriction en 5' : Ncol ou Ndel et en 3' : BamHI, ceci pour permettre le 
clonage oriente dans le vecteur d'expressionbacterienpET-14b. Les oligonucleotides intemes 
qui servent a verifier Tidentite des sequences, n'en ont pas. 

Amplification PGR : 

30 La manipulation a et6 repetee sur deux pools differents d'ARN totaux pour une 

mSme espece et un mSme tissu. 

La reaction d' amplification a ete reaUs6e directement sur le premier brin d'ADNc 
synthetise a partir des ARN totaux. 
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La reaction d'amplifieation avec les couples d'oligonucleotides 5'olOSP-3'olOSP 
(SEQ ID N° 9 at 10) ou 5'olOSPl-3'olOSP (SEQ ID N° 11 et 10) sur les ADNc de cals 
genere un fragment de 1,6 kb, Sur ce fragment, ime PGR a ete realisee avec les couples 
d'oligonucleotides 5'olOSPl-olMIPP2 et oIMIPPl-3'olOSP, oIMIPPl et olMIPP2 etant des 
5 oligonucleotides internes, generant respectivement une amplification k 0,2 kb et 1,4 kb. Ce 
resultat montre la presence du site RHGXRXP dans le fragment de 1,6 kb. Par consequent, il 
a ete clone dans pGEM-T (Promega) et sequence. 

1.2.4 - Deduction de la sequence d'acides amines et analyse 
10 La sequence d'acide nucleique et la sequence d'acides amines sont en annexe, respectivement 
par SEQIDN°3 et4, 

Caracteristiques biochimiques de OsMIPP : 
Masse moleculaire calcul6e 56,5 kDa 
15 pi 8,3 

Avec les logiciels de detection de motifs proteiques, identification de : 

- un peptide signal putatif de 18 acides amines a Textremite N-terminale de la proteine : 
MAAPRTPLPLVLLLVSAA (SEQ ID n°16) 

- un signal de retention dans le reticulum endoplasmique a I'extremite C-terminale de la 
20 proteine : KSEL 

1.3 - Analyse des sequences proteiques deduites des clones d'ADNc OsMIPP et 
ZmMIPP 

L3.1 - Comparaison OsMIPP et ZmMIPP 
25 Les sequences proteiques des proteines MIPP de liz et de mais sont fortement 

homologues entre elles. Les resultats de cet alignement, obtenu au moyen du logiciel MAC 
VECTOR™ 6.5.3 - Oxford Molecular, sont presentes en annexe, figure L 

1.3.2 - Comparaison entre OsMIPP/ZniMIPP et phosphatases acides 
30 Une bioanalyse avec les sequences proteiques donees par les ADNc, comme 

precedemment, met en evidence des homologies avec deux families de phosphatases acides : 
les MIPP animales et les phytases fongiques. Les resultats de cette etude sont presentes en 
annexe, figure 3. 
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Les MIPP sont des proteines decrites uniquement dans le domaine animal. Ces 
proteines hydrolysent les composes inositol polyphosphate, paiticulierement les tetra-^ penta-, 
et hexa-inositol phosphate, par consequent I'acide phytique (Craxton et al, 1997). Ceci 
suggere que les ADNc de mais et de riz ainsi clones codent pour des enz3nm.es homologues 
des MEPP animales, avec notanmient une activite phytasique. 

1.4 - Obtention de PADNc codant pour une MIPP de hU 

La comparaison des caracteristiques biochimiques des MIPP de riz et de mais 
avec la phj^ase de ble met en evidence des similarites : 

Riz* Mais* Ble^ (Johansen et al, 1997) 

Masse moleculaire kDa 56.5 ± 2.5 58.6 ± 3.5 47 

pi 8.3 8.95 7.4-8.2 

* valeurs calculees. 
^ valeurs apparentes. 



De plus, 11 a ete constate que les MIPP des plantes sont homologues aux MIPP 
animales et aux phytases fongiques, proteines pour lesquelles xme activite phytasique est 
d6crite. 

Ces deux constatations montrent fortement que la phytase de son du grain de ble 
est xme MIPP. 

Les grains de ble Triticum aestivum a differents stades de developpement : 10, 20, 
30 et 40 jours apres anthese (JAA) ont ete utilises comme materiel vegetal. 

Chez le ble, la fecondation a lieu dans la fleur encore fermee, par consequent elle 
n'est pas visible. Lorsqu'elle a eu lieu, les antheres apparaissent, c'est la floraison. Cette etape 
correspond egalement a la fin de Tanthese ou developpement des antheres. C'est a partir de ce 
moment que sont comptes les jours correspondant a la periode de developpement du grain. 

Les auteurs de Tinvention reaUse une cinetique de T activite phytasique d'une 
fraction du grain enrichie en son au cours du developpement k 10, 20, 30 et 40 JAA. Cette 
activity phytasique augmente au cours du developpement du grain. Cette augmentation pent 
s'expliquer par une activation des enzymes et/ou par une accimiulation des enzymes dans le 
son au coijrs du developpement du grain. 

L'extraction des ARN totaux a ensuite ete effectuee pour les 4 stades : 10, 20, 30, 
40 JAA. Des cinetiques d'expression, c'est a dire des Northern blots, avec la sonde OsMP 
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(nucleotide 105 au nucleotide 1506 - sequence correspondant aux 467 acides amines de la 
partie C-terminale de la proteine) ou la sonde ZmMP nucleotide 1 au nucleotide 1572 - 
(sequence correspondant aux 524 acides amines de la proteine), ont ete realisees sur les ARN 
totaux extraits a partir de son de grain preleve a 10, 20, 30 et 40 JAA. 
5 Par ailleurs, les ADNc correspondant aux ARN totaux extraits de son preleve aux 

4 stades de developpement du grain, ont ete synfhetises. 

L'isolement de 1' ADNc MIPP de ble est effectu6 par RT-PCR ou par RACE-PCR. 
Les oligonucleotides utilises pour les reactions d' amplification, sont detemoines k partir des 
sequences nucleiques des clones d'ADNc MIPP de riz et de mai's dan& les zones oii les 

10 homologies de sequences sont les plus fortes. On pent egalement utiliser des oligonucleotides 
d6gen6res, determines a partir des sequences d'acides nucleiques, notamment celle de riz et de 
mais, correspondant aux regions N et C-terminales des MIPP vegetales. 

Par ailleurs, la sequence nucleique de TADNc OsMIPP a ete utilisee pour 
rechercher des sequences homologues dans des bases d'EST de ble Triticum aestivum. Un 

15 EST issu d'ADNc de ble a ete retenue, elle est nommee 3'TaMIPP (SEQ ID N^14). La 
sequence proteique deduite de TEST presente une forte homologie avec les 58 acides amines 
de la partie C-terminale de la proteine OsMIPP. Cette EST a ete utilisee pour d6finir deux 
amorces olMIPP9 et olMIPPlO (SEQ ID N°12 , SEQ ID N°13). Ces amorces combinees avec 
Tamorce Smart n oligonucleotide™ du kit SMART PGR cDNA synthesis Kit (Clontech), 

20 permettent d'isoler par PGR un ADNc codant pour une MIPP de ble. La PGR genere divers 
firagments qui sont s6pares en gel d' agarose, transferes sur une membrane nylon et hybrides 
avec la sonde ZmMP. Les fragments recoimus par la sonde ZmMP sont homologues a 
ZmMIPP. 

25 

EXEMPLE 2 ; Production des proteines ZmMIPP et OsMIPP 
Chez E.coU et evaluation de ractivite phytasique des proteines recombinantes 

2.1 - Clonage dans le vecteur d'expression pET-14b 

30 Le site de restriction Ndel, amene par les oligonucl6otides 5'olZMPl et 5'olQSPl 

et le site de restriction BarnHL, amene par les oligonucleotides 3'olZMPl et 3'olOSPl, 
encadrent les ADNc ZmMIPP et OsMIPP. lis permettent le clonage oriente et en phase des 
ADNc aux sites de restriction Ndel et BamBI du vecteur d' expression bacterien pET-14b 
(Novagen). Les vecteurs obtenus pET-OsMIPP et pET-ZmMIPP ont ete verifies par 
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2.2 - Production des MIPP chez E. coli 

La production des proteines se fait selon les recommandations du foumisseijr 
5 Novagen. Des bacteries coli souche BL21(pE3)pLysS ont ete utilisees. Le vectexir pLysS 
permet d'eviter Texpression de la proteine recombinante alors que la production n'a pas ete 
induite et facilite la lyse des cellules car il porte le gene codant pour le lysozyme du phage T7. 

Des bacteries E, coli souche BL21(DE3)pLysS sont transformees avec les 
vecteurs pET-OsMIPP et pET-^ZmMEPP ; ces transformants bacteriens servent respectivement 
10 pour la production des prot6ines OsMIPP et ZnoMIPP. Des bacteries E. coli souche 
BL21(DE3)pLysS sont transformees avec pET-14b ; ces transformants bacteriens servCT.t de 
contr61e negatif de production. Des bacteries E, coli souche BL21(DE3)pLysS sont utilisees 
egalement comme controle negatif de production. 

15 Chaque transformant bacterien est mis en culture dans 5 ml de milieu LB (milieu 

de Luria-Bertaai) en presence des antibiotiques adequats a 37°C sous agitation (175 rpm) 
pendant 15 heures. Deux antibiotiques sont utilises : la carbenicilline et le chloramphenicoL 
La r6sistance au chloramphenicol est apportee par le vecteur pLysS (concentration utilisee : 
30 fxg/ml). La resistance a la carbenicilline est apportee par le vecteur pET- 14b (concentration 

20 utilisee : 50 p.g/ml). L'utilisation appropriee d'lm ou des deux antibiotiques permet de 
s61ectionner les transformants bacteriens qui contiennent les vecteurs pLysS et/ou pET-14b. 
Un volume de 1 ml de chaque preculture est utilisee pour ensemencer un volume de 100 ml 
de miheu LB avec les antibiotiques adequats contenu dans un erlenmeyer de 500 ml. Les 
cultures sont incubees a 37''C, sous agitation (175 rpm), jusqu'a ce que la densite optique a 

25 600 nm soit de DO600nm =0,6. Lorsque la DOeoonm = 0,6 : les 100 ml de milieu LB sont 
repartis equitablement dans deux erlenmeyer de 250 ml. Le premier sert a la production de 
proteines. L'induction de la production se fait par ajout de 500 |il d'IPTG 100 niML soit une 
concentration finale de 1 mM. La production se fait pendant 6 h a 30°C sous agitation 
(175 rpm). Le second erlenmeyer sert de temoin non induit. II est incube 6 h a 30°C sous 

30 agitation (175 rpm). 

Apres production, la culture bacterienne est centrifugee a 3000 rpm pendant 5 min 
a 4*^0. Le culot bacterien est repris dans un volume de tampon TE pH 8,0 (Tris-HCl 10 mM, 
EDTA 1 mM) tel que le rapport volume TE / volimie culture soit de 1/20, Les bacteries sont 
stockees i -80*^C. Les bacteries sont lysees en deux etapes : une etape de congelation- 
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decongelation (deux cycles congelation a -SO^'C / decongelation a 37"^ C), une etape 
d'ultrasons : 3 fois 15 s, 30 4 pulses / s. Entre chaque cycle, rechantillon est place dans la 
glace. Un cocktail d'inhibiteurs de proteases est ajoute au lysat bacterien, qui contient les 
proteines bacteriennes et les proteines h6terologues, afin de les preserver. 



2.3 - Dosage proteique 

La concentration en proteines totales des extraits est 6valuee selon la methode de 
Bradford (1976). Dans une plaque de microtitration, 2 jil de lysat bacterien sont ajoutes a 
10 200 111 de reactif de Coomassie (Bio-Rad protein assay). Pour le temoin negatif, Textrait 
proteique est remplace par 2 jiil de tampon TE pH 8,0. Apres homogeneisation, les 
absorbances sont lues a 595 nm avec un fluorimetre (Labsystems Genesis V2.00) assiste du 
logiciel (Labsystems). La quantite de proteines est determinee d' apres une courbe etalon 
realisee avec de I'albumine de serum bovin (1 mg/ml). 

15 

2,4 - Analyse des extraits proteiques par ^lectrophorese en gel de 
polyacrylamide en presence de sodium dodecyl sulfate (SDS-PAGE) 

EUe a ete reaUsee selon la m6thode de Laemmli (1970) en suivant les instructions 
de Bio-Rad. 

20 Le gel de separation est a 10 % de polyacrylamide (acrylamide/bisacrylamide, 

29/1, p/v) contenant du Tris-HCl 0,38 M pH 8,8 et du SDS 0,1 (p/v). Le gel de concentration 
est a 4 % de polyacrylamide contenant du Tris-HCl 0,12 M pH 6,8 et du SDS 0,1 % (p/v). La 
polymerisation du gel s'effectue en presence de persulfate d' ammonium 0,05 % (p/v) et de 
Temed 0,078 % (v/v). Une quantite de 40 |ig de proteines est utilisee pour Tanalyse SDS- 

25 PAGE. Les proteines sont reprises dans le tampon de depot compose de Tris-HCl 30 mM, 
pH 6,8, de glycerol 12,5 % (v/v), de SDS 1 % (p/v), de bleu de bromophenol 0,005 % (p/v), . 
en presence de dithiothreitol 100 mM et/ou de 2-mercaptoethanol 360 . Les echantillons sont 
incub6s a 100*^0 pendant 5 minutes avant depot en gel. Des proteines precolorees 
BENCHMARK prestained protein ladder (Gibco BRL) sont utilisees comme marqueurs de 

30 masses moleculaires. Le tampon de migration est compose de Tris-base 25 mM, de glycine 
0,2 M et de SDS 0,1 % (p/v). L'electrophorese est realisee a voltage constant 150 volts 
pendant 1 hevure a temperature ambiante. Apres migration, le gel est rince trois fois 
10 minutes dans de Teau, les proteines sont colorees par une solution de bleu de Coomassie 
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G250 (Bio-Safe Coomassie, Bio-Rad) pendant 1 heure, le gel est ensuite rince dans I'eau, a 
temperature ambiante, 

L'analyse SDS-PAGE a ete realisee sur des extraits bacteriens brats. La presence 
de la proteine het6rologue dans la culture bacterienne apres induction de la production est 

5 difficile k determiner. Une analyse par Western blot avec un anticorps approprie permet de 
confiraier la presence de la prot6ine heterologue. En effet, dans ce cas, la proteine heterologue 
a Tavantage d'etre synthetisee avec un peptide k son extremite N-terminale. Des anticorps 
sp6cifiques de ce peptide sont commercialis6s et peuvent Stre utilises pour mettre en evidence 
la proteine heterologue. Ceci va dans le sens des travaux de Craxton et aL (1997) : lors des 

10 essais de production chez E. coli d'une MIPP animale, la proteine n'a pu dtre d6tectee que par 
immunodetection. 



2.5 - Evaluation de Factivite phytasique 

15 L'activite phytasique est determinee par le dosage de phosphate Ubere par 

r enzyme partir de phytate de sodium. La mesure de Tactivite phytase est realisee 
directement sur les lysats bacteriens. . 

Dans un tube Ependorf de 1,5 ml, on melange 75 [il de lysat bacterien avec 300 jal 
d'une solution contenant du phytate de sodium 5 mM, de Tacetate de sodium 0,25 M pH 4,8, 

20 du CaCl2 1 mM. La reaction enzymatique se fait pendant 1 heure a 55*^0. Pour chaque essai, 
xm temoin identique est garde a 0°C pendant Tincubation. Ce temoin utilise comme zero, 
permet d'eliminer les absorbances possibles dues aux extraits proteiques eux-memes. La 
reaction enzymatique est arretee par Tajout de 375 jiil d'acide trichloroacetique 20 % (p/v), 
suivie d'une centrifugation a 8000 rpm pendant 15 minutes et a 4°C qui permet de precipiter 

25 les proteines. Le dosage du phosphate libre se fait sur le sumageant. A 750 jil de sumageant, 
on ajoute 750 |il du reactif suivant : FeS04 0,38 M, H2SO4 0,16 N / molybdate d'ammonium 
12 mM, H2SO4 1 N, 1 / 4, v/v. L'absorbance est mesuree a 690 nm. La quantite de phosphate 
est determinee a partir d'une cburbe standard. L'activite phytasique est exprimee en nmoles 
de phosphate libere par heure, par mg de proteines totales a 55°C. 

30 

L'activite phytasique a et6 r6alisee sur des extraits bacteriensUne etape de 
purification de la proteine heterologue a partir des extraits bacteriens bruts est neamnoins 
preferable pour ameliorer Tinterpretation des resultats. Ceci est aisement envisageable de part 
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la presence du peptide a Textremite N-terminale de la proteine heterologue*qui permet de la :> 
purifier par chromatographie d' affinite. 



3,1 - Pour une expression ectopique constitutive de OsMIPP 

Pour obtenir una expression constitutive, le promoteur pCsVMV (Verdaguer et 
aL, 1996, 1998) du virus de la mosaique de la nervure du manioc est utilise. 



- Le fragment Clal-Sacll de 556 pb du vecteur pRD 257 (figure 4) contient le promoteur 
pCsVMV. Ce fragment est clone dans le vecteur p3214 (figure 5) digere par Clal et 
EcoBl. Le vecteur obtenu est nomme vecteur pBIOS 366. II contient le promoteur 
pCsVMV et le terminateur ter nos. 

15 - L'ADNc OsMIPP a ete clone dans le vecteur pGEM-T (Promega) doimant le vecteur 
pBIOS 367. Le vecteur pBIOS 367 est digere par Notl generant un fragment de 1563 pb 
contenant I'ADNc OsMIPP complet. Ce fragment est clone dans le vecteur pBIOS 366 
digere par Pstl. On obtient le vecteur pBIOS 368 qui contient la cassette ; promoteur 
pCsVMV, ADNc OsMIPP, terminateur ter nos. 

20 - Le vecteur pBIOS 368 est digere par Xhol^ ce qui permet de sortir la cassette : promoteur 
pCsVMV, ADNc OsMIPP, terminateur ter nos. Elle est clonee au site Xhol du vecteur 
binaire pBIOS 273. Le vecteur pBIOS 273 contient I'ADN-T d'Arabidopsis thaliana dans 
lequel se trouvent le promoteur pActl et le premier intron du gene Actl de riz, la 
sequence codante du gene bar et le terminateur nos. Le vecteur obtenu est le vecteur 

25 pBIOS 369. Le vecteur pBIOS 369 comporte d'une part TADN-T dans lequel se trouvent 

la cassette d' expression du gene OsMIPP, insere entre le promoteur pCsVMV et le 
temiinateur Nos, la cassette d' expression du gene de selection, le gene Bar insere entre le 
promoteur pActl et le premier intron du gdne Actl de riz et le terminateur nos. D'autre 
part, pBIOS 369 contient egalement le gene de la resistance a la spectinomycine et ime 

30 origine de replication fonctionnelle chez E. coli 



5 



EXEMPLE 3 : Construction de genes chimeriques. 



10 



Le construit est realise de la fa9on suivante : 



3.2 



~ Pour une expression ectopique tissu-specifique de OsMIPP 
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Poiir obtenir une expression albumen-specifique, le promoteur pHMWG :du gene 
codant pour une glutenine de masse moleculaire elevee de ble (HMWG : High Molecular 
Weight Glutenin) est utilise. 

Le construit permettant T expression de OsMIPP dans le cj^oplasme des cellules 
de r albumen est r6alise de la fa9on suivante : 

- La digestion par T enzyme EcoRI da vecteur pBIOS 367 gen^re uu jfragment de 1547 pb 
contenant TADNc OsMIPP complet. Ce fragment est clone au site EcoRl du vecteur p3214 
entre le promoteirr pHMWG et le terminateur ter nos. Le vecteur obtenu est appele vecteur 
pBIOS 370. 

- La digestion du vecteur pBIOS 370 par Tenzyme Xhol genere un fragment de 2287 pb qui 

est clone au site XIiol du vecteur binaire pBIOS 273. Le vecteur obtenu est nonraie 
pBIOS 271. Le vecteur pBIOS 371 comporte d'xme part TADN-T dans lequel se trouvent 
la cassette d' expression du gene OsMIPP, insere entre le promoteur pHMWG et le 
terminateur Nos, la cassette d'expression du gene de selection, le gene Bar insere entre le 
promoteur pActl et le premier intron du gene Actl de riz et le terminateur nos. D'autre 
part, pBIOS 371 contient egalement le gene de la resistance a la spectinomycine et une 
origine de replication chez E. coli. 

3.3 - Pour une expression ectopique albumen-specifique de ZmMIPP 

Pour obtenir une expression albumen-specifique, le promoteur pHMWG du gene 
codant pour une glutenine de masse moleculaire elevee de ble (HMWG : High Molecular 
Weight Glutenin) est utilise. 

Le construit permettant I'expression de ZmMIPP dans les cellules de I'albimien est 
realise de la fa9on suivante : 

- La digestion par les enzymes EcoRl et BamUL du vecteur ZM4 (fragment 
ZmMIPP dans le vecteur pGEM-T easy) genere un fragment de 1600 pb contenant TADNc 
ZmMIPP complet. Ce fragment est clone aux sites EcoRI et BamBl du vecteur P3214 (figure 
5) entre le promoteur pHMWG et le terminateur ter NOS. Le vecteur obtenu est appele 
vecteur pBIOS 421 et d6crit figure 6. 

- La digestion du vecteur pBIOS 421 par les enzymes Sad et Sali genere un 
fragment de 2335 pb. L'extremite du fragment de 2335 .pb diger6 par Tenzyme Sad est rendue 
franche par un traitement a Texonuclease 3*-5' portee par Tenzyme T4 DNA polymerase de 
New England Biolabs. Ce fragment est ensuite clon6 aux sites Pmel et Xhol d*un vecteur 
binaire deriv6 de pSB12 (Japan Tobacco, EP 672 752) dans lequel a ete inseree une cassette 
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d'expression du gene de selection decrite ci-dessus. Le veoteur obtenu est nGimne pHMWG- 
ZmMIPP-JT. Le vecteur pHMWO-ZmMIPP-JT comporte d'une part I'ADN-T dans lequel se 
trouvent la cassette d'expression du gene ZmMIPP, insere entre le promoteur pHMWG et le 
terminateur ter NOS, la cassette d'expression du gene de selection, le gene Bar (White et al, 
5 1990) insere entre le promoteur pActlet le premier intron Actl de riz et le terminateur ter 
NOS, La cassette d'expression du gene de selection est egalement inseree entre les elements 
transposables Ac/Ds (Lechelt et al, 1989) qui pennettent ime excision de la cassette de 
selection apres action d'lme transposase. D'autre part le vecteur pHMWG-ZmMIPP-JT 
contient egalement le gene de la r6sistance a la spectinomycine et une origine de r6plication 
10 chez^. colu 

3.4 - Pour une expression ectopique embrvon-speciflque de ZmMIPP 

Pour obtenir xme expression embryon-specifique, et plus particulierement 
scutellum-specifique, le promoteur pHyPRP du gene codant pour une proteine hybride riche 
15 en proline de mais (HyPRP : Hybrid Proline Rich Protein) est utilise. 

Le constniit peraiettant Texpression de ZmMIPP dans les cellules de Tembryon est 
realise de la fa9on suivante : 

- La digestion par les enzymes Apal et Ndel du vecteur pBIOS 413 (fragment 
pHyPRP dans vecteur pBluescript) genere un fragment de 2162 pb contenant le promoteur du 

20 gene pHyPRP decrit par Jose-Estanyol et al (1992). Ce fragment est clone aux sites Apal et 
Ndel du vecteur pBIOS 421 devant I'ADNc ZmMIPP complet et le terminateur ter NOS. Le 
vecteur obtenu est appele vecteur pBIOS 422 decrit figure 7. 

- La digestion du vecteur pBIOS 422 par les enzymes Sad et Apal genere un 
fragment de 4050 pb, Les extremites du fragment de 4050 pb sont rendues franches par un 

25 traitement a Texonuclease 3-5* portee par Tenzyme T4 DNA polymerase de New England 

Biolabs. Ce fragment est ensuite clone aux sites Pmel et Xhol du vecteur binaire pBIOS 
342, les extremites du vecteur etant rendues franches par un traitement avec Tenzyme T4 
DNA polymerase de New England Biolabs. Ce fragment est ensuite clone aux sites Pmel 
et Xhol d'un vecteur derive depSB112 (Japan Tobacco EP 672 752) comme decrit dans 

30 Texemple precedent. Le vecteur obtenu est nomme pHyPRP-ZniMIPP-JT. Le vecteur 

pHyPRP-ZmMIPP-JT comporte d'une part TADN-T dans lequel se trouvent la cassette 
d'expression du gene ZnciMIPP, insere entre le promoteur pHyPRP et le terminateur ter 
NOS, la cassette d'expression du gene de selection, le gene Bar insere entre le promoteur 
p Act let le premier intron Actl de riz et le terminateur ter NOS. La cassette d'expression 
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du gene de selection est egalement inseree entre les elements transposables Ac/Ds qui 
permettent une excision de la cassette de selection apres action d'une transposase, D'autre 
part le vecteur pHyPRP-ZmMIPP-JT contient egalement le gene de la resistance a la 
spectinomycine et ime oxigine de replication chez E. coli. 

5 

EXEMPLE 4 ; Production de mais transforme 

4-1 - Transformation du mais par bombardement de particules 

La transformation genetique du mais par bombardement de particules se fait sur 

10 des cellules de cals friables embryo genes ou cals de type II. Ces cals sont obtenus a partir 
d'embryons immatures de genotype Hill ou A188 x B73 selon la methode decrite par 
Armstrong (1994). Les cals ainsi obtenus peuvent etre multiplies et maintenus par repiquages 
successifs tous les 15 jours sur le milieu d'initiation. Des plantules sont regenerees a partir de 
ces cals par modification de Tequilibre hormonal et osmotique des cellules selon la methode 

15 decrite par Vain et al (1 989). 

Le transfert des genes d'interet et de selection par bombardement de particules 
dans les cals de type n se fait selon le protocole suivant. Quatre heures avant le 
bombardement, des fragments de cals de type II d'une surface de 10 a 20 mm^ sont disposes 
au centre d'une boWe de Petri contenant le milieu d'initiation additionn6 de mannitol 0,2 M et 

20 de sorbitol 0,2 M, 1 6 fragments par bolte. 

Les vecteurs porteurs des genes d'interSt et de selection sont prepares a Taide du 
systeme CONCERT selon les instructions du foumisseur (GIBCO BRL). lis sont ensuite 
precipites sur des particules de tungstene (MIO) en suivant le protocole decrit par Klein 
(1987). Les particules ainsi enrobees sont projetees vers les cellules cibles a Taide d'un canon 

25 a particules. L' optimisation des conditions de bombardenient pent dependre du type 
d'appareil utilise et fait partie des techniques normalement maitrisees par I'homme de Tart. 

Apres bombardement, les boites sont scell6es a Taide de Scellofrais® et placees k 
robscurite a 27°C. Les cals sont transferes sur un milieu d'initiation additionne d'lm agent 
selectif 24 h apres le bombardement. 
30 Les cals sont maintenus sur ce milieu pendant 3 mois, le milieu est change tous les 

15 jours. Les cals dont la croissance n'est pas inhibee par Tagent selectif sont habituellement 
et majoritairement composes de cellules resultant de la division d'une cellule ayant integre 
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dans son patrimoine genetique une ou plusieurs copies du ^gene de selection. La frequence 
d'obtention de tels cals est d'environ 0,8 cals par boite bombardee. 

Ces cals sont identifies, individualises, multiplies puis cultives de fa9on a 
reg6nerer des plantules. Afin d'eviter toute interference avec des cellules non transform6es, 
toutes ces operations sont menees sur des milieux de culture contenant T agent selectif. 

Les plantes ainsi r6gen6rees sont acclimat6es puis cultivees en serre ou elles 
peuvent etre croisees ou auto-f6cond6es. 

4.2- Transformation du mais par Agrobacterium tumefaciens 

L?i transformation du mais pai Agrobacterium se fait selon la methode de Ishida et 

al (1996). 

4,2.1- Obtention du vecteur superbinaire 

Le vecteur superbinaire utilise pour la transformation du mais est issu de la 
recombinaison homologue entre deux vecteurs : le vecteur pBIOS 371 et le vecteur pSBl. Le 
vecteur pBIOS 371, construit comme prec6demment (exemple 3.2), comporte d'une part 
TADN-T dans lequel se trouvent la cassette d'e>qpression du gene OsMIPP, iisere entre le 
promoteur pHMWG et le terminateur Nos, la cassette d' expression du gene de selection, le 
gene Bar. D'autre part, pBIOS 371 contient egalement le gene de la resistance a la 
spectinomycine et une origine de replication chez E. coli, Le vecteur pSBl contient les genes 
virB, virC et virG du plasmide pTiBo542 pr6sent dans Agrobacterium souche A281 (ATCC 
37349), le gene de la resistance a la tetracycline, une origine de replication fonctionnelle chez 
E, coli et Agrobacterium. Les vecteurs pSBl et pBIOS 371 possedent une region homologue 
qui leur permet de se recombiner et de generer le vecteur superbinaire pRec 371 . 

La recombinaison homologue entre les deux vecteurs se fait dans Agrobacterium. 
Le vecteur pBIOS 371 est introduit dans Agrobacterium souche LBA4404 contenant le 
vecteur pSBl par electroporation en utiUsant Tappareil CELL PORATOR Voltage Booster 
(GIBCO BRL) selon la m6thode decrite par Mattanovitch et al (1989) et le protocole donne 
par le foumisseur (Life Technologies, USA). 

Les agrobacteries contenant le vecteur superbinaire pRec 371 sont selectionnees 
sur miheu YT en presence de CaCla, de rifampicine et de spectinomycine. Le gene de 
resistance a la rifampicine est porte par le chromosome bacterien. La resistance k la 
spectinomycine, portee par le vecteur pBIOS 371 (origine de replication fonctioimelle chez E. 
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coli), ne pourra s'exprimer qu'apres recombinaison liomologue avec le vecteur pSBl (origine 
de replication fonctioimelle chez Agrobacterimn et E. coli), 

Le vecteur superbinaire pRec 371 possede FADN-T dans lequel se trouvent les 
cassettes d'expression du gene Bar et de la s6quence OsMIPPs (sous le controle du promoteur 
pHMWG pour une expression tissu specifique), des origines de replication fonctionnelles h. la 
fois dans E. coli et Agrobacterium, les genes de resistance k la t6tracycline et a la 
spectinomycine, et les g^nes de virulence virB, virC et virG du plasmide pTiBo542. 

4.2.2 — M6thode de transformation du mai's et regen6ration des plantes transformees 
Des embryons immatures sent co-cultives avec A. tumefaciens souche LBA 4404, 

contenant le vecteur superbinaire pendant 5 minutes, puis places sur un milieu d'initiation de 

la callogenese pendant 5 jours a Tobscurite et a 25'^C. 

Les cals transformes sont selectionnes sur un milieu de culture contenant T agent 

selectif et I'agent bact6riostatique, la cefotaxime. Des cals de type I sont obtenus, a partir de 

ceux-ci, des plantules vont Stre regenerees sur un milieu culture contenant T agent selectif et 

Tagent bacteriostatique, la cefotaxime. Les plantules ayant r6gen6r6 sont ensuite transferees 

sur un milieu de developpement contenant I'agent selectif. 

Les plantes obtenues sont acclimatees au phytotron, puis cultivees en serre oh 

elles peuvent 6tre croisees ou auto-fecond6es. 

4.3 - Le gene Bar 

La nature et la concentration de T agent selectif peuvent varier selon le gene 
utilise. Les agents selectifs utilisables sont generalement des composes actifs de certains 

herbicides (Basta®, Roxmd up®) ou certains antibiotiques (Hygromycine, Kanamycine,). 

Le gene Bar de Streptomyces hygroscopicus code pour une phosphinothricine 
acetyl transferase (PAT) qui inactive par acetylation la phosphinotricine - molecule active de 

rherbicide Basta® . Les cellules portant ce gene sont done rendues r6sistantes a cet herbicide 
et peuvent Stre selectionnees par son intermediaire. 

Pour la transformation des cereales, la sequence codante du gene Bar est sous le 
controle d'une region regulatrice permettant une expression forte et constitutive dans les 
cellules vegetales. Une telle region peut avantageusement etre constituee par le promoteur et 
le premier intron du gene Actine 1 de riz (Mc Elroy et aL, 1991). 
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4.3.1 - Utilisation du gene Bar datis la transformation par bombardement de 
particules 

Le gene chimerique, compose du promoteur et du premier intron du gene Actine 1 
de riz et du gene Bar, est clon6 dans le plasmide pDM 302 pennettant sa multiplication chez 
5 E. coli (Cao et aL, 1992). Les milieux de cultures destin6s k la selection des cellules 
transformees sont additionn6s de phosphinothricine 2 mg/1. 

Pour rintroduction des construits OsMIPP devant conduire a une expression 
ectopique des proteiiies issues des genes OsMIPP, une technique dite de cotransformation 
peut avantageusement etre utilisee. On procede k une coprecipitation des deux plasmides (le 
10 plasmide porteur du gbno Bar et le plasmide porteur du gene OsMIPP) sur les particules de 
tungstene, la quantite to tale d'ADN precipite sur les particules restant identique a ce qu'elle 
est dans le protocole standard (5 fxg d'ADN pour 2,5 mg de particules), chaque plasmide 
representera environ la moitie du total d' ADN utilise. 

L' experience montre qu'avec cette methode, la cointegration des plasmides dans 
15 les cellules vegetales est Tev^nement le plus frequent (de Tordre de 90 %) c'est-a-dire que 
pratiquement chaque plante ayant integre le gene Bar et ayant et6 selectionnee par son 
intermediaire portera aussi le gfene MIPP. Ainsi, le pourcentage de plantes s61ectioimees 
exprimant le gene OsMIPP est d'environ 70 %. 

Les genes ainsi introduits sont generalement lies au sens genetique, le gene 
20 OsMIPP peut ainsi avantageusement Stre suivi dans les descendances grace a la resistance a 
rherbicide qui lui est etroitement associee. 

4.3.2 - Utilisation du gene Bar dans la transformation par bombardement de 
particules 

25 Le vecteur superbinaire pRec 371 possede TADN-T dans lequel se trouvent les 

cassettes d' expression des genes Bar et OsMIPP, des origines de replication fonctionnelles a 
la fois dans E, coli et Agrobacterium, les genes de resistance a la tetracycline et a la 
spectinomycine, et les genes de virulence virB, virC et virG du plasmide pTiBo542. 

Des embryons immatures sont co-cultives avec A. tumefaciens souche LBA 4404, 

30 contenant le vecteur superbinaire pRec 371 pendant 5 minutes, puis places sur uu milieu 
d'initiation de la callogenese pendant 5 jours a Tobscurite et a 25°C, La selection des cals de 
type I transformes et la regeneration des plantules se fait sur un milieu contenant de la 
phosphinotricine 5 a 10 mg/1 et un agent bacteriostatique, la cefotaxime. Le developpement 
des plantules se fait sur un milieu contenant uniquement la phosphinotricine. 
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Les cals et les plantes qui ont integre dans leur genome, TADN-T qui contient le 
gene OsMIPP et le gene Bar, peuvent etre suivis dans les descendances grace a la resistance a 
rherbicide. 



5 4.4 - Mesure de Factivit6 phytasique du mai's transform^ 

L'objectif final de la production de mai's transfortne avec le gene OsMIPP etant 
Tobtentiori d'une activite phytasique accrue, des mesures d'activite enzymatique sont prevus. 
Le dosage de T activite phytasique se fait selon la methode decrite precedemment dans 
Texemple 2 paragraphe 2.5. L'activite phytasique est mesur^e sur les extraits proteiques de 

10 differents organes de mais transgenique et de mais non transgenique : feuilles, graines, jeunes 
plantules en cours de germination (5 ou 6 jours de germination). L' extraction des proteines 
totales a partir de ces tissus se fait selon la methode decrite ci-apres. Les tissus, preleves et 
congeles a — SO^C, sont broyes a Tetat de poudre dans I'azote liquide. Une quantite de 100 mg 
de poudre vegetale broyee est transferee dans 1 ml de tampon d' extraction (acetate de sodium 

15 100 mM, pH 4,8, CaCl2 2 mM, DTT 1 mM, cocktail d'inhibiteurs de proteases 0,5 a 1 mM 
(Roche)). Les echantillons sont homogeneises pendant 1 heure a 4°C et les extraits sont 
centrifug6s k 8000 rpm pendant 20 min a 4°C. Le sumageant contenant les proteines totales, 
sert a la mesure de I'activite phytasique. 

20 

EXEMPLE 5 : Production de riz transforme 

La production de riz transfomie peut etre envisagee selon deux methodes : via 
Agrobacterium tumefaciens selon le protocole decrit par Hiei et aL (1994), par bombardement 
25 de particules selon le protocole de Fauquet et al (1996). Les vecteurs pBIOS 369 et pBIOS 
371 decrits dans Texemple 3, sont utiUses pour la transformation du riz via Agrobacterium 
tumefaciens. 

30 EXEMPLE 6 ; Production de ble transform^. 

La transformation du ble {Triticum aestivum) peut se faire selon la methode 
decrite dans le brevet EP 0674 715 Bl. 
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6.1 - Preparation des tissus a transformer 

Les tissus utilises pour le transfert de genes ont ete prepares salon la methode 
decrite dans le brevet BP 0674 715 Bl. Ce sont des cals de type M qui sont utilises pour le 
bombardement. lis peuvent 8tre obtenus h partir d'embryons immatures preleves des grains 
5 immatures de ble et places sur un milieu MS decrit par Murashige et Skoog (1962) contenant 
du maltose. 

6.2 - Preparation des vecteurs a transferer 

Les vecteurs utilises pour la transformation du ble sont purifies sur gradient de 
10 Cesium puis concentre a 1 mg/ml dans le tampon TE pH 8,0 (Tris-HCl 10 mM ; EDTA 
1 mM) (Sambrook et al, 1989). 



6,3 - Preparation des particules d'or 

Des particules d'or de 1 \xxa sont emrobees d'ADN a transferer scion le procede de 
15 Daines (1990). Les particules sont reprises dans de rethanol absolu, 60 mg de particules par 
ml d'ethanol. Un volume de 35 |xl de cette suspension est transfer^ dans un tube de micro- 
centrifugation de 1,5 ml, les particxxles sont recuperees par centrifiigation a 14 000 g pendant 
3 minutes. EUes sont lav6es avec 1,5 ml d'eau distillee sterile et recuperees par centrifiigation 
a 14 000 g pendant 3 minutes. Les particules sont reprises dans 25 jxl de tampon TE contenant 
20 25 }xg du vecteur portant le gene d'interSt et 25 jiig du vecteur portant le gene de selection, le 
gene dhfr codant pour Tenzyme dihydrofolate reductase. On ajoute a cette preparation, dans 
rordre : 220 \i\ d'eau distillee sterile, 250 fxl de CaCb 2,5 M et 50 |li1 de spermidine 0,1 M. Le 
melange est homogeneise par agitation a 4°C pendant 15 minutes, Le melange est centrifiige 
pendant 5 minutes a 14 000 g, le sumageant est elimine et les particules lavees avec 200 |li1 
25 d'ethanol absolu. Les particules d'or chargees d'ADN sont reprises dans 36 |xl d'ethanol 
absolu. 



6.4 - Etape de transformation 

Le deroulement du bombardement dies cellules s'est effectue telle que la demande 
30 de brevet EP 0 674 715 le decrit. Dans la chambre du canon, la boite de Petri contenant les 
explants a bombarder est placee sur la plate-forme au centre de Touverture d'ou sont projetees 
les particules d'or enrobees d'ADN ou microprojectiles. Les microprojectiles sont places sur 
un support au dessus des explants. La chambre est fermee et scellee, le vide de la chambre est 
realise et le reservoir d'heliimi rempli avec ime quantite appropriee de gaz. Le bombardement 
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iCst declenche permettant la projection des microprojectiles sur les explants. Les explants sont 
bombardes deux fois avec les microprojectiles. Apres bombardement, les cals sont maintenus 
a Tobscurite pendant 15 heiores puis places sur le milieu MS pendant 15 jours. 

5 6.5 - Selection des cals et regeneration des plantes transgSniques. 

La selection des cals transformes se fait le milieu MS contenant Tagent selectif, le 
methotrexate pendant 4 mois. 

Pour regenerer des plantes, les cals sont transferees sur un milieu MS contenant 
du 2,4-D k Tobscurite. Quand des structures embryogenes apparaissent, les cals sont 
10 transferes sur un milieu MS contenant des hormones (auxines et gibberellines) a la lumiere 
pendant 15 jours, cette etape permet I'induction de tiges. Les explants sont ensuite transferes 
sur un milieu MS sans hormone afin de permettre I'induction des racines. 

Les plantules sont acclimatees en phytotron avant d'etre cultivees en serre. 



15 
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REVENDICATIONS 
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I. Acide nucleique isole codant pour me MIPP (Multiple Inositol Polyphosphate 
Phosphatase) vegetale a activite phytasique. 

5 2. Acide nucleique isole selon la revendication 1, caracterise en ce qu*il comprend la 
sequence SEQ ID n°l, n° 3, n° 17 ou une sequence homologue d*une de ces sequences. 

3. Acide nucleique isole selon la revendication 1, caracteris6 en ce qu'il comprend une 
sequence homologue de la sequence SEQ ID n°l, n°3 ou n° 17, ladite sequence 
homologue etant definie comme 

10 i) une sequence similaire a au moins 70 % de la sequence SEQ ID n° 1, n° 3 ou n° 17 ; 

ou 

ii) une sequence hybridant avec la sequence SEQ ID n° 1, n° 3 ou n° 17 ou sa 
sequence complementaire, dans des conditions stringentes d'hybridation, ou 

iii) une sequence codant pour une enz3ane MIPP vegetale comprenant la sequence 
15 d'acides amines SEQ ID n°2, n°4 ou n° 18. 

4. Acide nucleique isole selon la revendication 1 ou 2, caracteris6 en ce qu'il comprend la 
sequence SEQ ID n*^ 17 ou une sequence homologue a la sequence SEQ ID n° 17. 

5. En2ryme isolee MIPP (Multiple Inositol Polyphosphate Phosphatase) veg6tale a activite 
phytasique, 

20 6. Enzyme isolee MIPP vegetale selon la revendication 4, comprenant une sequence d'acides 
amines SEQ ID N°2, SEQ ID N°4 ou SEQ ID N° 18. 

7. Enzyme isolee selon la revendication 6, caracterisee en ce qu'il comprend la sequence 
SEQIDn° 18. 

8. Enzyme isolee MIPP vegetale selon la revendication 5, comprenant une sequence d'acides 
25 amines similaire a au moins 70% de la sequence SEQ ID N'*2, SEQ ID N°4 ou SEQ ID N° 

18. 

9. Cassette d' expression contenant au moins une des sequences selon les revendications 1 a 
4 placee sous le contrdle d'au moins une sequence regulatrice capable de commander 
Texpression de la proteine MIPP v6getale. 

30 10. Cassette d'expression selon la revendication 9, caract6risee en ce que la sequence 
regulatrice est un promoteur. 

II, Cassette d* expression selon la revendication 10, caracterisee en ce que le promoteur est 
sp^cifique d'un organe ou d'un tissu de la plante. 



wo 02/00890 PCT/FROl/02116 

41 

12. Cassette d'expression selon la revendication 11/ caracterisee en ce que le protnoteur 
specifique est choisi parmi les promoteurs de genes codant pour ime glutenine de masse 
moleculaire elevee HMWG de ble ou d'orge, la napine, la phaseoline, rheKanthiiiine, 
Palbimiine, I'oleosine, GEAl et GEA6 d'Arabidopsis thaliana, la y-z^ine de mai's, le 
5 promoteur pHyPRP du gfene codant pour una proteine hybride .riche en proline de mai's, le 

promoteur Vpl du gene Viviparous 1 combine au premier intron Sh du ghne Shrunken. 
,13. Cassette d'expression selon Tune des revendications 9 a 12, caracteris6e en ce qu'une 
sequence regulatrice comprend un signal d'adressage. 

14. Cassette d'expression selon la revendication 13, caracterisee en ce que le signal 
10 d'adressage est une sequence codant pour un peptide signal N-terminaL 

15. Cassette d'expression selon la revendication 14, caracterisee en ce que le signal 
d'adressage comporte un signal de retention endoplasmique a Textremite C-terminale. 

16. Cassette d'expression selon la revendication 14, caracterisee en ce que le signal 
d'adressage ne comporte pas de signal de retention endoplasmique a I'extremite C- 

15 terminale. 

17. Vecteur nucleotidique dans lequel est inseree une cassette d'expression telle que delBnie 
dans Tune des revendications 9 a 16. 

18. Hote cellulaire contenant un vecteur nucleotidique selon la revendication 17. 

19. Procede de production de plantes transgeniques comprenant les etapes de : 

20 - transformation de cellules de plante avec une sequence d'acide nucleique selon 

Tune des revendications 1 a 4 ou un vecteur selon la revendication 17, 

- selection des cellules transformees, 

- generation des plantes transformees a partir de ces cellules, exprimant une MIPP 
vegetale a activite phytasique codec par ladite sequence d'acide nucleique. 

25 20. Plante transformee susceptible d'etre obtenue par le procede de la revendication 17. 

21. Partie d'une plante, notamment semence, caracterisee en ce qu'elle provient d'une plante 
transformee selon la revendication 20. 

22. Produit, notanmient farine, susceptible d'gtre obtenu a partir d'une plante transformee 
selon la revendication 20 ou d'une partie d'une plante transformee selon la revendication 

30 21. 

23. Methode de production de proteine MIPP vegetale, caracterisee en ce qu'elle comprend les 
etapes de : 

a) transformation d'une cellule, en particulier d'un vegetal ou d'un microorganisme, 
avec une cassette d'expression selon Tune des revendications 9 a 16, 
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b) eventuellement culture de ladite cellule hote ou, dans le cas ou cette cellule hote 
est une cellule vegetale, croissance de la plante transformee, 

c) extraction de la proteine MIPP de la culture cellulaire ou de la plaate transformee. 

24. Utilisation d'une plante ou partie d'une plante selon les revendications 20 ou 21, ou 
5 encore d'un produit selon la revendication 22, dans toute situation dans laquelle I'activite 

phytasique est necessaire ou desir6e. 

25. Utilisation selon la revendication 24, pour liberer le phosphate inorganique et/ou 
am61iorer la disponibilite des cations chelates par la ph3rtine tels que le fer, le calcium, le 
magnesium ou le zinc. 

10 26. Utilisation d'lme cassette d'expression selon Tune des revendications 9 a 16 pour 
Tobtention de plante transgenique productrice de graines contenant une MIPP. . 
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<222> (1) . , (1575) 

<400> 1 

ggc atg get get ccg cgc gcg ccg ctg cct etc ccc caa ctg ctg 48 

Met Gly Met Ala Ala Pro Arg Ala Pro Leu Pro Leu Pro Gin Leu Leu 
15 10 15 

etc etc etc gtt gee gcg etc etc gcc gee get ege etc cct agg gcg 96 
Leu Leu Leu Val Ala Ala Leu Leu Ala Ala Ala Arg Leu Pro Arg Ala 
20 25 30 

gcc agg gcg gac gag tte gat gtc cgc ege cac etc tec acc gtc ace 144 
Ala Arg Ala Asp Glu Phe Asp Val Arg Arg His Leu Ser Thr Val Thr 
35 40 45 

agg tat gat gtg gee agg gag tec agt agt gtc ate tec atg ccg tea 192 
Arg Tyr Asp Val Ala Arg Glu Ser Ser Ser Val lie Ser Met Pro Ser 
50 55 60 

ate eca gac ggg tgc egt gtc att cac etc aat tta gtg gea aga cat 240 
He Pro Asp Gly Cys Arg Val He His Leu Asn Leu Val Ala Arg His 
65 70 75 80 

ggg act cgc get cct ace aag aag cgc ate aag gag ctg gat aga ttg • 288 
Gly Thr Arg Ala Pro Thr Lys Lys Arg He Lys Glu Leu Asp Arg Leu 
85 90 95 

gca gtt cga ctg gaa gcc ctt ctg aaa gag gcg aat cag gtc ctt gat 336 
Ala Val Arg Leu Glu Ala Leu Leu Lys Glu Ala Asn Gin Val Leu Asp 
100 105 110 

agt gat tet ctg aag aaa att eca tec tgg att aaa ggc tgg gaa tea 384 
Ser Asp Ser Leu Lys Lys He Pro Ser Trp He Lys Gly Trp Glu Ser 
115 120 125 



cgc tgg aag ggt agg act aaa ggt ggt gag ctg att agt gaa ggg gaa 
Arg Trp Lys Gly Arg Thr Lys Gly Gly Glu Leu He Ser Glu Gly Glu 
130 135 140 



432 
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gag gag ctt tac aat tta get acc aga atg agg gag agg ttt caa gat 480 
Glu Glu Leu Tyr Asn Leu Ala Thr Arg Met Arg Glu Arg Phe Gin Asp 
145 150 155 160 

eta ttt gat gac gaa tat cac cct gat gta tat tea ata aga gca acc 528 
Leu Phe Asp Asp Glu Tyr His Pro Asp Val Tyr Ser lie Arg Ala Thr 
165 170 175 

cag gtt cct cga gca tea get agt gca gtg gca ttt ggg ttg gga eta 576 
Gin Val Pro Arg Ala Ser Ala Ser Ala Val Ala Phe Gly Leu Gly Leu 
180 185 190 

ctt tct ggg aaa gga aag ett gga caa ggg aag aae cga gee ttt tct 624 
Leu Ser Gly Lys Gly Lys Leu Gly Gin Gly Lys Asn Arg Ala Phe Ser 
195 200 205 

gtt ctg agt gag agt cgt gca agt gat att tgt ctg aga tte ttt gac 672 
Val Leu Ser Glu Ser Arg Ala Ser Asp lie Cys Leu Arg Phe Phe Asp 
210 215 220 

age tgt gag aca tac aag gca tac agg aaa agg aag gag cct gat gta 720 
Ser Cys Glu Thr Tyr Lys Ala Tyr Arg Lys Arg Lys Glu Pro Asp Val 
225 230 235 240 

gag aag caa aag gaa cea att eta gag cat gtc aca get gca ctt gtc 768 
Glu Lys Gin Lys Glu Pro lie Leu Glu His Val Thr Ala Ala Leu Val 

245 250 255 

aat cgt tat cac eta aaa ttt aca act cgc gat gtt tct tee etc tgg 816 
Asn Arg Tyr His Leu Lys Phe Thr Thr Arg Asp Val Ser Ser Leu Trp 
260 265 270 

ttt ctt tgt aag cag gaa aca tct ttg ttg aat aca aca aat caa get 864 
Phe Leu Cys Lys Gin Glu Thr Ser Leu Leu Asn Thr Thr Asn Gin Ala 
275 280 285 

tgt ggg ctt ttt aat gaa get gag gtt cgt ttt ctg gag tgg aca gat 912 
Cys Gly Leu Phe Asn Glu Ala Glu Val Arg Phe Leu Glu Trp Thr Asp 
290 295 300 

gat ttg gag ggt ttt gtt eta aaa ggc tat ggt gag tea att aae tac 960 
Asp Leu Glu Gly Phe Val Leu Lys Gly Tyr Gly Glu Ser lie Asn Tyr 
305 310 315 320 

agg atg gga ctg cea ttg etc aag gat gtt gtc cag tea atg gaa gaa 1008 
Arg Met Gly Leu Pro Leu Leu Lys Asp Val Val Gin Ser Met Glu Glu 
325 330 335 

gca ate ata get aga gaa gaa aae cgt get gat ggt aeg ttt gaa aag 1056 
Ala lie lie Ala Arg Glu Glu Asn Arg Ala Asp Gly Thr Phe Glu Lys 
340 345 350 

gca agg etc cga ttt gca cat gca gaa act gtt gtt cct ttt age tgc 1104 
Ala Arg Leu Arg Phe Ala His Ala Glu Thr Val Val Pro Phe Ser Cys 
355 360 365 

Ctt ett ggt ctt ttt ctt gaa ggt cea gaa att gag aag ata cag aga 1152 
Leu Leu Gly Leu Phe Leu Glu Gly Pro Glu He Glu Lys He Gin Arg 
370 375 380 
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gag gaa gca ttg gac eta. ccc cct ttg ccg cca cag gga aga aac tgg . ,1200 

Glu Glu Ala Leu Asp Leu Pro Pro Leu Pro Pro Gin Gly Arg Asn Trp 
385 390 395 400 

aag ggc agt gtt gtt gcg cct ttc get ggt aac aat atg ctg gtt tta 1248 

Lys Gly Ser Val Val Ala Pro Phe Ala Gly Asn Asn Met Leu Val Leu 
405 410 415 

tat caa tgt cca age aaa att teg gat ggc age aca ate tct gga ggc 1296 

Tyr Gin Cys Pro Ser Lys He Ser Asp Gly Ser Thr He Ser Gly Gly 
420 425 430 

ega aac aac tct tac tta gtt caa gtt eta cac aac gaa gtc cca gtt 1344 

Arg Asn Asn Ser Tyr Leu Val Gin Val Leu His Asn Glu Val Pro Val 

435 440 445 

tea atg cct ggg tgc ggc aac aaa gat ttc tgt ccg ttc gag gag ttc 1392 

Ser Met Pro Gly Cys Gly Asn Lys Asp Phe Cys Pro Phe Glu Glu Phe 
450 455 460 

aag gag aaa att gtg aaa ccg cac ctg aag cac gac tac aac atg ata 1440 

Lys Glu Lys He Val Lys Pro His Leu Lys His Asp Tyr Asn Met He 
465 470 475 480 

tgc aag gtc aaa tec cca gcg gca age gag gag cct gee teg ttc gee 1488 

Cys Lys Val Lys Ser Pro Ala Ala Ser Glu Glu Pro Ala Ser Phe Ala 
485 490 495 

tec agg gtg tec agt ttc ttc eta gga etc etc teg cag aaa ggg tac 1536 

Ser Arg Val Ser Ser Phe Phe Leu Gly Leu Leu Ser Gin Lys Gly Tyr 
500 505 510 

cgc ggt gtg ggc gee gag ggc gtc aag acc gag ctg tag 1575 
Arg Gly Val Gly Ala Glu Gly Val Lys Thr Glu Leu 

515 520 525 



<210> 2 

<211> 524 

<212> PRT 

<213> Zea mays 

<400> 2 

Met Gly Met Ala Ala Pro Arg Ala Pro Leu Pro Leu Pro Gin Leu Leu 
15 10 15 

Leu Leu Leu Val Ala Ala Leu Leu Ala Ala Ala Arg Leu Pro Arg Ala 
20 25 30 

Ala Arg Ala Asp Glu Phe Asp Val Arg Arg His Leu Ser Thr Val Thr 
35 40 45 

Arg Tyr Asp Val Ala Arg Glu Ser Ser Ser Val He Ser Met Pro Ser 
50 55 60 

He Pro Asp Gly Cys Arg Val He His Leu Asn Leu Val Ala Arg His 
65 70 75 -80 

Gly Thr Arg Ala Pro Thr Lys Lys Arg He Lys Glu Leu Asp Arg Leu 
85 90 95 
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Ala Val Arg Leu Glu Ala Leu Leu Lys Glu Ala Asn Gin Val Leu Asp 
100 105 110 

Ser Asp Ser Leu Lys Lys lie Pro Ser Trp He Lys Gly Trp Glu Ser 
115 120 125 

Arg Trp Lys Gly Arg Thr Lys Gly Gly Glu Leu He Ser Glu Gly Glu 
130 135 140 

Glu Glu Leu Tyr Asn Leu Ala Thr Arg Met Arg Glu Arg Phe Gin Asp 
145 150 155 160 

Leu Phe Asp Asp Glu Tyr His Pro Asp Val Tyr Ser He Arg Ala Thr 
165 170 175 

Gin Val Pro Arg Ala Ser Ala Ser Ala Val Ala Phe Gly Leu Gly Leu 
180 185 190 

Leu Ser Gly Lys Gly Lys Leu Gly Gin Gly Lys Asn Arg Ala Phe Ser 
195 200 205 

Val Leu Ser Glu Ser Arg Ala Ser Asp lie Cys Leu Arg Phe Phe Asp 
210 215 220 

Ser Cys Glu Thr Tyr Lys Ala Tyr Arg Lys Arg Lys Glu Pro Asp Val 
225 230 235 240 

Glu Lys Gin Lys Glu Pro He Leu Glu His Val Thr Ala Ala Leu Val 
245 250 255 

Asn Arg Tyr His Leu Lys Phe Thr Thr Arg Asp Val Ser Ser Leu Trp 
260 265 270 

Phe Leu Cys Lys Gin Glu Thr Ser Leu Leu Asn Thr Thr Asn Gin Ala 
275 280 285 

Cys Gly Leu Phe Asn Glu Ala Glu Val Arg Phe Leu Glu Trp Thr Asp 
290 295 300 

Asp Leu Glu Gly Phe Val Leu Lys Gly Tyr Gly Glu Ser He Asn Tyr 
305 310 315 320 

Arg Met Gly Leu Pro Leu Leu Lys Asp Val Val Gin Ser Met Glu Glu 
325 330 335 

Ala He He Ala Arg Glu Glu Asn Arg Ala Asp Gly Thr Phe Glu Lys 
340 345 350 

Ala Arg Leu Arg Phe Ala His Ala Glu Thr Val Val Pro Phe Ser Cys 
355 360 . .365 

Leu Leu Gly Leu Phe Leu Glu Gly Pro Glu He Glu Lys He Gin Arg 
370 375 380 

Glu Glu Ala Leu Asp Leu Pro Pro Leu Pro Pro Gin Gly Arg Asn Trp 
385 390 395 400 

Lys Gly Ser Val Val Ala Pro Phe Ala Gly Asn Asn Met Leu Val Leu 
405 410 415 

Tyr Gin Cys Pro Ser Lys He Ser Asp Gly Ser Thr He Ser Gly Gly 
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420 

Arg Asn Asn Ser Tyr Leu 
435 

Ser Met Pro Gly Cys Gly 
450 

Lys Glu Lys lie Val Lys 
465 470 

Cys Lys Val Lys Ser Pro 
485 



5 

425 

Val Gin Val Leu His Asix Glu 
440 445 

Asn Lys Asp Phe Cys Pro Phe 
455 460 

Pro His Leu Lys His Asp Tyr 
475 

Ala Ala Ser Glu Glu Pro Ala 
490 



PCT/FROl/02116 

430 

Val Pro Val 

Glu Glu Phe 

Asn Met lie 
480 

Ser Phe Ala 
495 



Ser Arg Val Ser 
500 

Arg Gly Val Gly 
515 



Ser Phe Phe Leu 

Ala Glu Gly Val 
520 



Gly Leu Leu Ser 
505 

Lys Thr Glu Leu 



Gin Lys Gly Tyr 
510 



<210> 3 
<211> 1509 
<212> ADN 
<213> riz 

<220> 

<221> CDS 

<222> (1) . . (1509) 

<400> 3 

atg get get cee cgc acg cct etc ccc etc gtc etc etc etc gte tee 48 

Met Ala Ala Pro Arg Thr Pro Leu Pro Leu Val Leu Leu Leu Val Ser 

1 5 10 15 

gee gcg ttc gae gtc cgc cgc cac etc tec ace gte ace agg tac gat 96 
Ala Ala Phe Asp Val Arg Arg His Leu Ser Thr Val Thr Arg Tyr Asp 
20 25 30 

gtg gcg agg gga tec aat agt gtg tec tec gcg eeg tct atg teg gat 144 
Val Ala Arg Gly Ser Asn Ser Val Ser Ser Ala Pro Ser Met Ser Asp 

35 40 45 

gag tgc cgc gtg ate cac etc aat etc gtg gea aga cat ggg act cgc 192 
Glu Cys Arg Val lie His Leu Asn Leu Val Ala Arg His Gly Thr Arg 
50 55 60 

gea cct ace aaa aag aga ate aaa gag etg gat aga ctg gcg gtt egg 240 
Ala Pro Thr Lys Lys Arg lie Lys Glu Leu Asp Arg Leu Ala Val Arg 
65 70 75 80 

ttg aag get ctt ate gat gaa gea aaa caa ggg cct gaa agt gae tec 288 
Leu Lys Ala Leu lie Asp Glu Ala Lys Gin Gly Pro Glu Ser Asp Ser 
85 90 95 

ctg aaa aaa att cct tea tgg atg aaa ggg tgg gag tea ccc tgg aaa 33 6 
Leu Lys Lys lie Pro Ser Trp Met Lys Gly Trp Glu Ser Pro Trp Lys 
100 105 110 

ggt agg gtg aaa ggt ggt gag ctg gtc agt gaa ggg gag gaa gag eta 3 84 
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Gly Arg Val Lys Gly Gly Glu Leu Val Ser Glu Gly Glu Glu Glu Leu 
115 120 125 

tac aac ctt get ate aga gtc aag gag agg ttt caa ggc eta ttt gat 432 
Tyr Ash Leu Ala lie Arg Val Lys Glu Arg Phe Gin Gly Leu Phe Asp 
130 135 140 

gag gaa tat cac cct gat gtg tat tea ata aga gca act cag gtt cct 480 
Glu Glu Tyr His Pro Asp Val Tyr Ser lie Arg Ala Thr Gin Val Pro 
145 150 155 160 

egg gca tea get agt gea gta gea ttt ggt ttg ggt eta ctt tet ggg 528 
Arg Ala Ser Ala Ser Ala Val Ala Phe Gly Leu Gly Leu Leu Ser Gly 
165 170 175 

aaa ggg aag ctt gga cct gtg aaa aac cgt gcc ttt tct gtt ctg agt 576 
Lys Gly Lys Leu Gly Pro Val Lys Asn Arg Ala Phe Ser Val Leu Ser 

180 185 190 

gag agt cgt gca agt gat att tgt ctg cga ttc ttt gat age tgt gaa 624 
Glu Ser Arg Ala Ser Asp lie Cys Leu Arg Phe Phe Asp Ser Cys Glu 
195 200 205 

aca tac aag gac tac agg aaa aga aag gag cct gat gtt gaa aag caa 672 
Thr Tyr Lys Asp Tyr Arg Lys Arg Lys Glu Pro Asp Val Glu Lys Gin 
210 215 220 

aag gaa cca att tta gaa cac gtc aca teg gca tta gtt aac cgt tat 720 
Lys Glu Pro lie Leu Glu His Val Thr Ser Ala Leu Val Asn Arg Tyr 
225 230 235 240 

cat etc aat ttt aca cca aaa gat gtt tct tec etc tgg ttc ctt tgc 768 
His Leu Asn Phe Thr Pro Lys Asp Val Ser Ser Leu Trp Phe Leu Cys 
245 250 255 

aag cag gaa gca tct tta atg aat ata acc aat caa get tgt caa ctt 816 
Lys Gin Glu Ala Ser Leu Met Asn lie Thr Asn Gin Ala Cys Gin Leu 
260 265 270 

ttt aat gaa get gag gtt tat ttt eta gag tgg aca gat gat ctg gag 864 
Phe Asn Glu Ala Glu Val Tyr Phe Leu Glu Trp Thr Asp Asp Leu Glu 
275 280 285 

ggc ttt gtg eta aaa ggt tat ggt gag tea ata aac tat egg atg gga 912 
Gly Phe Val Leu Lys Gly Tyr Gly Glu Ser lie Asn Tyr Arg Met Gly 
290 295 300 

ctg cca ttg etc aag gac gtt gtc cag tea atg gaa gaa gca ate gtt 960 
Leu Pro Leu Leu Lys Asp Val Val Gin Ser Met Glu Glu Ala lie Val 
305 310 315 320 

get aaa gaa gaa aac cac cct gat ggt aca tat gag aag gca agg etc 1008 
Ala Lys Glu Glu Asn His Pro Asp Gly Thr Tyr Glu Lys Ala Arg Leu 
325 330 335 

cga ttt gca cat get gaa act gtt gtc cct ttc tea tgt ctt ctt ggt 1056 
Arg Phe Ala His Ala Glu Thr Val Val Pro Phe Ser Cys Leu Leu Gly 
340 345 350 



ctt ttt ctt gaa gga tea gat ttt gcg aag ata caa egg gag gaa tea 
Leu Phe Leu Glu Gly Ser Asp Phe Ala Lys lie Gin Arg Glu Glu Ser 



1104 
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ttg gac ata cct cct gtg cca cca cag gga aga aat tgg aag ggc agt 1152 
Leu Asp He Pro Pro Val Pro Pro Gin Gly Arg Asn Trp Lys Gly Ser 
370 375 380 

gtt gtt gca cct ttt get ggt aac aat atg ttg get ttg tac cag tgc 1200 
Val Val Ala Pro Phe Ala Gly Asn Asn Met Leu Ala Leu Tyr Gin Cys 
385 390 395 400 

cca gga aaa act gat ggt ggt aag att tct egg gat cag aag age tea 124 8 
Pro Gly Lys Thr Asp Gly Gly Lys He Ser Arg Asp Gin Lys Ser Ser 
405 410 415 

tac ttc gtg cag gtt ata cac aat gaa get cca gtt tea atg ccg gga 1296 
Tyr Phe Val Gin Val He His Asn Glu Ala Pro Val Ser Met Pro Gly 
420 425 430 

tgc ggg aac aaa gat ttc tgc cca ttt gaa gag ttc aag gag aag ata 1344 
Cys Gly Asn Lys Asp Phe Cys Pro Phe Glu Glu Phe Lys Glu Lys lie 
435 440 445 

gtt gaa cce cac ctg aag eat gac tac gac gee eta tgc aag ata agg 13 92 
Val Glu Pro His Leu Lys His Asp Tyr Asp Ala Leu Cys Lys He Arg 
450 455 460 

ccg gtg gca aga gag gag cct tec tec ttc agt tec agg atg tee aat 1440 
Pro Val Ala Arg Glu Glu Pro Ser Ser Phe Ser Ser Arg Met Ser Asn 
465 470 475 480 

ttc ttc eta ggt ttg ttc teg cag aaa gga tac cgt gtt agt get cag 1488 
Phe Phe Leu Gly Leu Phe Ser Gin Lys Gly Tyr Arg Val Ser Ala Gin 
485 490 495 

gat gtg aag teg gag ctg tag 1509 
Asp Val Lys Ser Glu Leu 
500 



<210> 4 
<211> 502 
<212> PRT 
<213> riz 



<400> 4 

Met Ala Ala Pro Arg Thr Pro Leu 
1 5 

Ala Ala Phe Asp Val Arg Arg His 
20 

Val Ala Arg Gly Ser Asn Ser Val 
35 40 

Glu Cys Arg Val He His Leu Asn 
50 55 

Ala Pro Thr Lys Lys Arg He Lys 
65 70 

Leu Lys Ala Leu He Asp Glu Ala 



Pro Leu Val Leu Leu Leu Val Ser 
10 15 

Leu Ser Thr Val Thr Arg Tyr Asp 
25 3 0 

Ser Ser Ala Pro Ser Met Ser Asp 
45 

Leu Val Ala Arg His Gly Thr Arg 
60 

Glu Leu Asp Arg Leu Ala Val Arg 
75 80 

Lys Gin Gly Pro Glu Ser Asp Ser 
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85 90 95 

Leu Lys Lys lie Pro Ser Trp Met Lys Gly Trp Glu Ser Pro Trp Lys 
100 105 110 

Gly Arg Val Lys Gly Gly Glu Leu Val Ser Glu Gly Glu Glu Glu Leu 
115 120 125 

Tyr Asn Leu Ala lie Arg Val Lys Glu Arg Phe Gin Gly Leu Phe Asp 
130 135 140 

Glu Glu Tyr His Pro Asp Val Tyr Ser lie Arg Ala Thr Gin Val Pro 
145 150 155 160 

Arg Ala Ser Ala Ser Ala Val Ala Phe Gly Leu Gly Leu Leu Ser Gly 
165 170 175 

Lys Gly Lys Leu Gly Pro Val Lys Asn Arg Ala Phe Ser Val Leu Ser 
180 185 190 

Glu Ser Arg Ala Ser Asp He Cys Leu Arg Phe Phe Asp Ser Gys Glu 
195 200 205 

Thr Tyr Lys Asp Tyr Arg Lys Arg Lys Glu Pro Asp Val Glu Lys Gin 
210 215 220 

Lys Glu Pro He Leu Glu His Val Thr Ser Ala Leu Val Asn Arg Tyr 
225 230 235 ^ 240 

His Leu Asn Phe Thr Pro Lys Asp Val Ser Ser Leu Trp Phe Leu Cys 
245 250 255 

Lys Gin Glu Ala Ser Leu Met Asn He Thr Asn Gin Ala Cys Gin Leu 
260 265 270 

Phe Asn Glu Ala Glu Val Tyr Phe Leu Glu Trp Thr Asp Asp Leu Glu 
275 280 285 

Gly Phe Val Leu Lys Gly Tyr Gly Glu Ser He Asn Tyr Arg Met Gly 
290 295 300 

Leu Pro Leu Leu Lys Asp Val Val Gin Ser Met Glu Glu Ala He Val 
305 310 315 320 

Ala Lys Glu Glu Asn His Pro Asp Gly Thr Tyr Glu Lys Ala Arg Leu 
325 330 335 

Arg Phe Ala His Ala Glu Thr Val Val Pro Phe Ser Gys Leu Leu Gly 
340 345 350 

Leu Phe Leu Glu Gly Ser Asp Phe Ala Lys He Gin Arg Glu Glu Ser 
355 360 365 

Leu Asp He Pro Pro Val Pro Pro Gin Gly Arg Asn Trp Lys Gly Ser 
370 375 380 

Val Val Ala Pro Phe Ala Gly Asn Asn Met Leu Ala Leu Tyr Gin Cys 
385 390 395 400 

Pro Gly Lys Thr Asp Gly Gly Lys He Ser Arg Asp Gin Lys Ser Ser 
405 410 415 
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Tyr Phe Val Gin Val lie His Asn Glu Ala Pro Val Ser Met Pro Gly 
420 425 430 

Cys Gly Asn Lys Asp Phe Cys Pro Phe Glu Glu Phe Lys Glu Lys He 
435 440 445 

Val Glu Pro His Leu Lys His Asp Tyr Asp Ala Leu Cys Lys He Arg 
450 455 460 

Pro Val Ala Arg Glu Glu Pro Ser Ser Phe Ser Ser Arg Met Ser Asn 
465 470 475 480 

Phe Phe Leu Gly Leu Phe Ser Gin Lys Gly Tyr Arg Val Ser Ala Gin 
485 490 495 

Asp Val Lys Ser Glu Leu 
500 



<210> 5 
<211> 22 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 
oligonucleotide 

<400> 5 . . ' ' 

catatgggca tggctgctcc' gc 22 



<210> 6 
<211> 26 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 
oligonucleotide 

<400> 6 

ggatcctagg tcttgacgcc tacagc 26 



<210> 7 

<211> 19 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 
oligonucleotide 

<400> 7 

caagacatgg gactcgcgc 19 



<210> 8 
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<211> 19 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence 
oligonucleotide 

<400> 8 

cgcgagtccc atgtcttgc 

<210> 9 
<211> 22 
<212> ADM 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence 
oligonucleotide 

<400> 9 

caaatcgatt cgccatggct gc 

<210> 10 
<211> 27 
<212> ADH 

<213> Sequence artificielle 

<220> 

<223> Description de la sequence 
oligonucleotide 

<400> 10 

ggatcctaca gctccgactt cacatcc 

<210> 11 
<211> 21 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence 
oligonucleotide 

<400> 11 

catatggctg ctccccgcac g 

<210> 12 
<211> 29 
<212> ADN 

<213> Sequence artificielle 
'<220> 

<223> Description de la sequence 
oligonucleotide 

<400> 12 



artificielle: 



19 



artificielle : 



22 



artificielle : 



27 



artificielle : 



21 



artificielle : 
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<210> 13 
<211> 25 
<212> ADN 

<213> Sequence artificielle 

<220> 

<223> Description de la sequence artificielle: 
oligonucleotide 

<400> 13 

gtctatcgtt tctattaagc cagac 25 



<210> 14 
<211> 478 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence 

artificielle :Description de la sequence 
artificielle : EST 

<400> 14 

ggcacgagcc gggggtggca gcagaggagg agccatcctc tttcagctcc aagctcaact 60 
tcttccttga tctgctctcg cggaaaggtt accgttttaa ggggcaagat gttaagacgg 12 0 
agctgtagag tacaggcgcc ttgtgccgcg acgaccttgg attaggactg acatgtggac 180 
actaaccttg gtgtttttgt acctaggttt ggtgacttgt' gagcgagttc agcgcgtatc 240 
aggctctgat ggcttgcagg tgccgccgtg tgcgagtctg gcttaataga aacgatagac 30 0 
tactcatatt aataaggaat tcttttttcg gaaaaaaaaa aaaaaaaaaa ctcgagagta 360 
cttntagagc ggccgcgggc ccatcgattt tncacccggg tggggtacca ggtaagtgta 420 
cccaattcgc cctatagtga gtcgnattac aattcactgg cccgcgnttt acaacgtn 478 



<210> 15 

<211> 25 
<212> PRT 

<213> Sequence artificielle 
<220> 

<22 3> Description de la sequence artificielle: peptide 

signal 

<400> 15 

Met Gly Met Ala Ala Pro Arg Ala Pro Leu Pro Leu Pro Gin Leu Leu 
15 10 15 

Leu Leu Leu Val Ala Ala Leu Leu Ala 
20 25 



<210> 16 
<211> 18 
<212> PRT 

<2i3> Sequence artificielle 



<220> 
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<223> Description de la sequence artif icielle : peptide 
signal 

<400> 16 

Met Ala Ala Pro Arg Thr Pro Leu Pro Leu Val Leu Leu Leu Val Ser 
1 5 10 15 



Ala Ala 



<210> 17 
<211> 1575 
<212> ADN 
<213> Zea mays 

<220> 

<221> CDS 

<222> (1) . . (1575) 

<400> 17 

atg ggc atg act gcg ccg cgc gcg ccg ctg cct etc ccc caa ctg ctg 48 

Met Gly Met Thr Ala Pro Arg Ala Pro Leu Pro Leu Pro Gin Leu Leu 
15 10 15 

etc etc etc gtt gcc gcg etc etc gee gcc get ccc etc cct agg gcg 96 
Leu Leu Leu Val Ala Ala Leu Leu Ala Ala Ala Pro Leu Pro Arg Ala 
20 25 30 

gcc agg gcg gac gag tte gae gtc cgc cgc cac etc tec ace gtc ace 144 
Ala Arg Ala Asp Glu Phe Asp Val Arg Arg His Leu Ser Thr Val Thr 
35 40 45 

agg tat gat gtg gcc agg gag tec agt agt gtc ate tec atg ccg tea 192 
Arg Tyr Asp Val Ala Arg Glu Ser Ser Ser Val He Ser Met Pro Ser 
50 55 60 

ate cca gac ggg tgc cgt gtc att cac etc aat tta gtg gea aga cat 240 
He Pro Asp Gly Cys Arg Val He His Leu Asn Leu Val Ala Arg His 
65 70 75 80 

ggg act cgc get cct ace aag aag cgc ate aag gag ctg gat aga ttg 288 
Gly Thr Arg Ala Pro Thr Lys Lys Arg He Lys Glu Leu Asp Arg Leu 
85 90 95 

gea gtt ega ctg gaa gee ett ctg aaa gag gea aat eag gtc ett gat 336 
Ala Val Arg Leu Glu Ala Leu Leu Lys Glu Ala Asn Gin Val Leu Asp 
100 105 110 

agt gat tct ctg aag aaa att cca tec tgg att aaa ggc tgg gaa tea 3 84 
Ser Asp ser Leu Lys Lys He Pro Ser Trp He Lys Gly Trp Glu Ser 
115 120 125 

cgc tgg aag ggt agg act aaa ggt ggt gag ctg att agt gaa ggg gaa 432 
Arg Trp Lys Gly Arg Thr Lys Gly Gly Glu Leu He Ser Glu Gly Glu 
130 135 140 



gag gag ett tac aat tta get ace aga atg agg 
Glu Glu Leu Tyr Asn Leu Ala Thr Arg Met Arg 
145 150 155 



gag agg ttt caa gat 
Glu Arg Phe Gin Asp 
160 



480 
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eta ttt gat gac gaa tat cac cct gat gta tat tea ata aga gca acc 528 
Leu Phe Asp Asp Glu Tyr His Pro Asp Val Tyr Ser lie Arg Ala Thr 
165 170 175 

cag gtt cct cga gca tea get agt gca gtg gca ttt ggg ttg gga eta 576 
Gin Val Pro Arg Ala Ser Ala Ser Ala Val Ala Phe Gly Leu Gly Leu 
180 185 190 



ett tct ggg aaa gga aag ctt gga eaa ggg aag aac ega gee ttt tct 
Leu Ser Gly Lys Gly Lys Leu Gly Gin Gly Lys Asn Arg Ala Phe Ser 
195 200 205 



624 



gtt ctg agt gag agt cgt gca agt gat att tgt etg aga ttc ttt gac 
Val Leu Ser Glu Ser Arg Ala Ser Asp lie Cys Leu Arg Phe Phe Asp 
210 215 220 



672 



age tgt gag aca tac aag gca tac agg aga agg aag gag cct gat gta 
Ser Cys Glu Thr Tyr Lys Ala Tyr Arg Arg Arg Lys Glu Pro Asp Val 
225 230 235 240 



720 



gag aag eaa aag gaa cca att eta gag cat gtc aca get gca ctt gtc 
Glu Lys Gin Lys Glu Pro lie Leu Glu His Val Thr Ala Ala Leu Val 
245 250 255 



768 



aat ■ cgt tat cac eta aaa ttt aca act cgc gat gtt tct tec etc tgg 
Asn Arg Tyr His Leu Lys Phe Thr Thr Arg Asp Val Ser Ser Leu Trp 
260 265 270 



816 



ttt ctt tgt aag cag gaa gca tct ttg ttg aat aca aca aat eaa get 
Phe Leu Cys Lys Gin Glu Ala Ser Leu Leu Asn Thr Thr Asn Gin Ala 
275 280 285 



864 



tgt ggg ctt ttt aat gaa get gag gtt cgt ttt ctg gag tgg aca gat 
Cys Gly Leu Phe Asn Glu Ala Glu Val Arg Phe Leu Glu Trp Thr Asp 
290 295 300 



912 



gat ttg gag ggt ttt gtt eta aaa ggc tat ggt gag tea att aac tac 
Asp Leu Glu Gly Phe Val Leu Lys Gly Tyr Gly Glu Ser He Asn Tyr 
305 310 315 320 



960 



agg atg gga ctg cca ttg etc aag gat gtt gtc cag tea atg gaa gaa 
Arg Met Gly Leu Pro Leu Leu Lys Asp Val Val Gin Ser Met Glu Glu 
325 330 335 



1008 



gca ate ata get aga gaa gaa aac cgt get gat ggt aeg ttt gaa aag 

Ala He He Ala Arg Glu Glu Asn Arg Ala Asp Gly Thr Phe Glu Lys 
340 ' 345 350 

gca agg etc cga ttt gca ctt gca gaa act gtt gtt cct ttt age tgc 

Ala Arg Leu Arg Phe Ala Leu Ala Glu Thr Val Val Pro Phe Ser Cys 
355 360 365 



1056 



1104 



ctt ctt ggt ctt ttt ett gaa ggt cca gaa att gag agg ata cag aga 1152 
Leu Leu Gly Leu Phe Leu Glu Gly Pro Glu lie Glu Arg He Gin Arg 
370 375 380 

gag gaa gca ttg gac eta ccc- cct ttg ccg cca cag gga aga aac tgg 1200 
Glu Glu Ala Leu Asp Leu Pro Pro Leu Pro Pro Gin Gly Arg Asn Trp 
385 390 395 400 
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aag ggc agt gtt gtt gcg cct ttt get ggt aac aat atg ctg gtt tta 1248 
Lys Gly Ser Val Val Ala Pro Phe Ala Gly Asn Asn Met Leu Val Leu 
405 410 415 

tat caa tgt cca age aaa att teg gat ggc age aca ate tet gga ggc 1296 
Tyr Gin Cys Pro Ser Lys lie Ser Asp Gly Ser Thr He Ser Gly Gly 
420 425 430 

cga aac aac tct tac tta gtt caa gtt eta cae aac gaa gte cca gtt 1344 
Arg Asn Asn Ser Tyr Leu Val Gin Val Leu His Asn Glu Val Pro Val 
435 440 445 

tea atg cct ggg tgc ggc aac aaa gat ttc tgt ccg tte gag gag tte 13 92 
Ser Met Pro Gly Cys Gly Asn Lys Asp Phe Cys Pro Phe Glu Glu Phe 
450 455 460 

aag gag aaa att gtg aaa ccg cac ctg aag cac gac tac aac atg ata 1440 
Lys Glu Lys He Val Lys Pro His Leu Lys His Asp Tyr Asn Met He 
465 470 475 480 

tgc aag gte aaa tee eea gcg gea age gag gag cct gee teg ttc gee 1488 
Cys Lys Val Lys Ser Pro Ala Ala Ser Glu Glu Pro Ala Ser Phe Ala 

485 490 495 

tec agg gtg tec agt tte tte eta gga etc etc teg cag aaa ggg tac 153 6 
Ser Arg Val Ser Ser Phe Phe Leu Gly Leu Leu Ser Gin Lys Gly Tyr 
500 505 510 

cgc ggt gtg ggc gcc gag ggc gte aag acc gag ctg tag 1575 
Arg Gly Val Gly Ala Glu Gly Val Lys. Thr Glu Leu 

515 ' - " 520 * 525 



<210> 18 

<211> 524 

<212> PRT 

<213> Zea mays 

<400> 18 

Met Gly Met Thr Ala Pro Arg Ala Pro Leu Pro Leu Pro Gin Leu Leu 
15 10 15 

Leu Leu Leu Val Ala Ala Leu Leu Ala Ala Ala Pro Leu Pro Arg Ala 
20 25 30 

Ala Arg Ala Asp Glu Phe Asp Val Arg Arg His Leu Ser Thr Val Thr 
35 40 45 

Arg Tyr Asp Val Ala Arg Glu Ser Ser Ser Val He Ser Met Pro Ser 

; 50 ■ . 55 60 

He Pro Asp Gly Cys Arg Val He His Leu Asn Leu Val Ala Arg His 

65 70 75 80 

Gly Thr Arg Ala Pro Thr Lys Lys Arg He Lys Glu Leu Asp Arg Leu 
85 90 95 

Ala Val Arg Leu Glu Ala Leu Leu Lys Glu Ala Asn Gin Val Leu Asp 
100 105 110 

Ser Asp Ser Leu Lys Lys He Pro Ser Trp He Lys Gly Trp Glu Ser 
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115 120 125 

Arg Trp Lys Gly Arg Thr Lys Gly Gly Glu Leu He Ser Glu Gly Glu 
130 135 140 

Glu Glu Leu Tyr Asn Leu Ala Thr Arg Met Arg Glu Arg Phe Gin Asp 
145 150 155 160 

Leu Phe Asp Asp Glu Tyr His Pro Asp Val Tyr Ser He Arg Ala Thr 
165 170 175 

Gin Val Pro Arg Ala Ser Ala Ser Ala Val Ala' Phe Gly Leu Gly Leu 
180 185 190 

Leu Ser Gly Lys Gly Lys Leu Gly Gin Gly Lys Asn Arg Ala Phe Ser 
195 200 205 

Val Leu Ser Glu Ser Arg Ala Ser Asp He Cys Leu Arg Phe Phe Asp 
210 215 220 

Ser Cys Glu Thr Tyr Lys Ala Tyr Arg Arg Arg Lys Glu Pro Asp Val 
225 230 235 240 

Glu Lys Gin Lys Glu Pro He Leu Glu His Val Thr Ala Ala Leu Val 
245 250 255 

Asn Arg Tyr His Leu Lys Phe Thr Thr Arg Asp Val Ser Ser Leu Trp 
260 265 270 

Phe Leu Cys Lys Gin Glu Ala Ser Leu Leu Asn Thr Thr Asn Gin Ala 
275 280 285 

Cys Gly Leu Phe Asn Glu Ala Glu Val Arg Phe Leu Glu Trp Thr Asp 
290 295 300 

Asp Leu Glu Gly Phe Val Leu Lys Gly Tyr Gly Glu Ser He Asn Tyr 
305 310 315 320 

Arg Met Gly Leu Pro Leu Leu Lys Asp Val Val Gin Ser Met Glu Glu 

325 330 335 

Ala He He Ala Arg Glu Glu Asn Arg Ala Asp Gly Thr Phe Glu Lys 
340 345 350 

Ala Arg Leu Arg Phe Ala Leu Ala Glu Thr Val Val Pro Phe Ser Cys 
355 360 365 

Leu Leu Gly Leu Phe Leu Glu Gly Pro Glu He Glu Arg He Gin Arg 
370 375 380 

Glu Glu Ala Leu Asp Leu Pro Pro Leu Pro Pro Gin Gly Arg Asn Trp 
385 390 395 400 

Lys Gly Ser Val Val Ala Pro Phe Ala Gly Asn Asn Met Leu Val Leu 
405 410 415 

Tyr Gin Cys Pro Ser Lys He Ser Asp Gly Ser Thr He Ser Gly Gly 
420 425 430 

Arg Asn Asn Ser Tyr Leu Val Gin Val Leu His Asn Glu Val Pro Val 
435 440 445 
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Ser Met Pro Gly Cys Gly Asn Lys Asp Phe Cys Pro Phe Glu Glu Phe 
450 455 460 

Lys Glu Lys lie Val Lys Pro His Leu Lys His Asp Tyr Asn Met lie 
465 470 475 480 

Cys Lys Val Lys Ser Pro Ala Ala Ser Glu Glu Pro Ala Ser Phe Ala 
485 490 495 

Ser Arg Val Ser Ser Phe Phe Leu Gly Leu Leu Ser Gin Lys Gly Tyr 
500 505 . 510 

Arg Gly Val Gly Ala Glu Gly Val Lys Thr Glu Leu 
515 520 
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